Linux配置深度学习环境
要了我老命,几乎半天时间都消耗在这了呜呜
推荐教程:
ChatGPT(绝境下的神中神,我差点淘宝付费找人远程了)
我的配置
- 天选5pro,Windows11系统,双系统安装了Ubuntu24.04 LTS
- 独立显卡:NVIDIA GeForce RTX 4060 Max-Q / Mobile
Ubuntu安装
之前的Blog发布过,就不写啦,可以到我之前的Blog看看
Miniconda安装
同上哈哈哈
显卡驱动安装
开始前的开始
重启进入bios,关闭secure boot:
把密钥全部删除,关闭安全启动(天选5pro)
由于我是双系统,这步一定要做!!!网上的博客教程都不会写是因为他们的计算机就是linux,我失败了无数次才发现最开始有个巨坑
安装准备
安装所需依赖:
sudo apt-get update
sudo apt-get install g++ gcc make
禁用nouveau:
打开文件夹:
sudo gedit /etc/modprobe.d/blacklist.conf
gedit用不了的话直接装一个
在末尾添加并保存:
1
2blacklist nouveau
options nouveau modeset=0改完要更新系统镜像文件:
sudo update-initramfs -u
重启ubuntu:
sudo reboot
验证禁用nouveau:
lsmod | grep nouveau
如果没有输出就说明禁用了nouveau
正式安装
查看推荐版本
1 | ubuntu-drivers devices |
找到后面标有recommand
的版本,记住这个版本号
- 我显示的是
driver : nvidia-driver-560 - third-party non-free recommended
- 尽量按照推荐版本安装,版本不高不要强求,不兼容下载过来也用不了
安装
1 | sudo apt install nvidia-driver-560 |
- 记住把上面代码的560改称你自己系统推荐的版本
- 过程比较慢,期间我上了节高数课
重启
1 | sudo reboot |
验证驱动是否正确安装
1 | nvidia-smi |
这会显示你显卡的相关信息
安装cuda
找到和你的显卡驱动匹配的cuda版本
- 很重要!!一定要匹配,不然折腾半天到最后会报错!!
- 可以搜博客(搜“cuda和显卡驱动版本对应”)也可以看官网:版本对应情况
准备安装
到官网找对应版本下载即可:nvidia_cuda官网下载
按你的计算机版本走:
把下面两行代码依次复制到终端运行,开始安装
安装
**安装过程中注意取消勾选Driver选项,以避免重复安装显卡驱动导致安装失败,**取消勾选后的界面如下图所示:
cuda配置
打开环境变量配置文件:gedit ~/.bashrc
添加以下内容:
1 | export PATH=/usr/local/cuda-12.6/bin:$PATH |
激活环境变量source ~/.bashrc
检查cuda是否安装正确
1 | nvcc --version |
出现以上结果即为安装成功
安装cudnn
找到和你的cuda匹配的cudnn版本
- 是的,cudnn也要和cuda版本对应
- 官网可查找:官网
安装
官网找到就可以直接点击进去安装了
提取
下载完成后,进入下载目录,进行以下操作:
提取cuDNN文件:
tar -xf xxx.tar.xz
注意:xxx.tar.xz改为你的包名,还有等下的cuda版本号
依次执行以下指令,将提取后的文件复制到cuda目录下,cuda版本不一样的注意修改路径:
sudo cp xxx/include/* /usr/local/cuda-12.6/include
sudo cp xxx/lib/libcudnn* /usr/local/cuda-12.6/lib64
(注意改版本号)
提升权限
sudo chmod 777 /usr/local/cuda-12.6/include/cudnn.h
sudo chmod 777 /usr/local/cuda-12.6/lib64/libcudnn*
(注意改版本号)
验证安装
终端输入以下代码:
1 | cat /usr/local/cuda-12.6/include/cudnn_version.h | grep CUDNN_MAJOR -A 2 |
(注意改版本号)
出现以上结果即为安装成功
结语
到这里安装就大功告成啦,感觉比较累,但很有成就感
如果你想再验证一下是否安装成功的话:
nvidia显卡驱动
1 | nvidia-smi |
会显示 GPU 的使用情况
CUDA和cuDNN
cuda可用python验证
1 | import torch |
这个是已经用conda创造了虚拟环境,并且安装了pytorch的情况下的验证方法
返回
True
,说明 PyTorch 检测到了 GPU返回
True
,说明 cuDNN 被启用