要了我老命,几乎半天时间都消耗在这了呜呜

推荐教程:

我的配置

  • 天选5pro,Windows11系统,双系统安装了Ubuntu24.04 LTS
  • 独立显卡:NVIDIA GeForce RTX 4060 Max-Q / Mobile

Ubuntu安装

之前的Blog发布过,就不写啦,可以到我之前的Blog看看

Miniconda安装

同上哈哈哈

显卡驱动安装

开始前的开始

重启进入bios,关闭secure boot

把密钥全部删除,关闭安全启动(天选5pro)

由于我是双系统,这步一定要做!!!网上的博客教程都不会写是因为他们的计算机就是linux,我失败了无数次才发现最开始有个巨坑

安装准备

安装所需依赖:

sudo apt-get update

sudo apt-get install g++ gcc make

禁用nouveau:

  1. 打开文件夹:

    sudo gedit /etc/modprobe.d/blacklist.conf

    gedit用不了的话直接装一个

  2. 在末尾添加并保存:

    1
    2
    blacklist nouveau
    options nouveau modeset=0
  3. 改完要更新系统镜像文件:

    sudo update-initramfs -u

  4. 重启ubuntu:

    sudo reboot

  5. 验证禁用nouveau:

    lsmod | grep nouveau 如果没有输出就说明禁用了nouveau

正式安装

查看推荐版本

1
ubuntu-drivers devices

找到后面标有recommand的版本,记住这个版本号

  • 我显示的是driver : nvidia-driver-560 - third-party non-free recommended
  • 尽量按照推荐版本安装,版本不高不要强求,不兼容下载过来也用不了

安装

1
sudo apt install nvidia-driver-560
  • 记住把上面代码的560改称你自己系统推荐的版本
  • 过程比较慢,期间我上了节高数课

重启

1
sudo reboot

验证驱动是否正确安装

1
nvidia-smi

这会显示你显卡的相关信息

安装cuda

找到和你的显卡驱动匹配的cuda版本

  • 很重要!!一定要匹配,不然折腾半天到最后会报错!!
  • 可以搜博客(搜“cuda和显卡驱动版本对应”)也可以看官网:版本对应情况

准备安装

  • 到官网找对应版本下载即可:nvidia_cuda官网下载

  • 按你的计算机版本走:

    cuda下载

  • 把下面两行代码依次复制到终端运行,开始安装

安装

**安装过程中注意取消勾选Driver选项,以避免重复安装显卡驱动导致安装失败,**取消勾选后的界面如下图所示:

取消勾选Driver项

cuda配置

打开环境变量配置文件:gedit ~/.bashrc

添加以下内容:

1
2
3
export PATH=/usr/local/cuda-12.6/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-12.6/lib64:$LD_LIBRARY_PATH

激活环境变量source ~/.bashrc

检查cuda是否安装正确

1
nvcc --version

检查cuda安装成功

出现以上结果即为安装成功

安装cudnn

找到和你的cuda匹配的cudnn版本

  • 是的,cudnn也要和cuda版本对应
  • 官网可查找:官网

安装

官网找到就可以直接点击进去安装了

cudn_download

提取

下载完成后,进入下载目录,进行以下操作:

  1. 提取cuDNN文件:tar -xf xxx.tar.xz

    注意:xxx.tar.xz改为你的包名,还有等下的cuda版本号

  2. 依次执行以下指令,将提取后的文件复制到cuda目录下,cuda版本不一样的注意修改路径

    sudo cp xxx/include/* /usr/local/cuda-12.6/include

    sudo cp xxx/lib/libcudnn* /usr/local/cuda-12.6/lib64

    (注意改版本号)

提升权限

sudo chmod 777 /usr/local/cuda-12.6/include/cudnn.h

sudo chmod 777 /usr/local/cuda-12.6/lib64/libcudnn*

(注意改版本号)

验证安装

终端输入以下代码:

1
cat /usr/local/cuda-12.6/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

(注意改版本号)

验证cudnn安装

出现以上结果即为安装成功

结语

到这里安装就大功告成啦,感觉比较累,但很有成就感

如果你想再验证一下是否安装成功的话:

nvidia显卡驱动

1
nvidia-smi

会显示 GPU 的使用情况

CUDA和cuDNN

cuda可用python验证

1
2
3
import torch
print(torch.cuda.is_available())
print(torch.backends.cudnn.enabled)
  • 这个是已经用conda创造了虚拟环境,并且安装了pytorch的情况下的验证方法

  • 返回True,说明 PyTorch 检测到了 GPU

  • 返回 True ,说明 cuDNN 被启用