(一)安装
1. 安装nvidia驱动,参考下面连接的方法一:
『heqingchun-ubuntu系统下安装nvidia显卡驱动3种方法』_ubuntu安装nvidia显卡驱动-CSDN博客
如果方法一不行,参照方法二,单独下载驱动,卸载原有驱动后,重新在黑窗模式下安装驱动。
【注意】如果方法一或方法二无法成功安装驱动,检查/var/log/nvidia-installer.log文件,可能原因为gcc版本不匹配,如下图所示:
解决方法:
卸载旧版gcc并重新安装:
sudo apt remove gcc
sudo apt install gcc-9
或者 sudo apt install gcc
sudo apt install g++
之后,再按照方法一或二安装驱动。
方法三没有成功,不清除原因。
2. 选择cuda版本与pytorch匹配
3. 安装cuda
参考:ubuntu22.04安装anaconda、cuda和cudnn_ubuntu 22.04 cudnn-CSDN博客
CUDA Toolkit Archive | NVIDIA Developer
4. 安装cuDNN
参考:ubuntu22.04安装anaconda、cuda和cudnn_ubuntu 22.04 cudnn-CSDN博客\
下载cuDNN Archive | NVIDIA Developer后:
1)安装zliblg
sudo apt-get install zlib1g
2)安装cudnn(在下载文件夹中打开terminal)
# 和下载的文集名保持一致
sudo dpkg -i cudnn-local-repo-ubuntu2204-8.9.3.28_1.0-1_amd64.deb
# 上一行代码运行结束后,terminal会提示:
sudo cp /var/cudnn-local-repo-ubuntu2204-8.9.3.28/cudnn-local-BD12C98D-keyring.gpg /usr/share/keyrings/
sudo apt-get update
#对应文件版本修改libcudnn8=***
sudo apt-get install libcudnn8=8.9.3.28-1+cuda12.1
3)验证是否安装成功
cp -r /usr/src/cudnn_samples_v8/ $HOME
cd $HOME/cudnn_samples_v8/mnistCUDNN
make clean && make
如果最后一行代码,make编译报错:
则,安装:
sudo apt-get install libfreeimage3 libfreeimage-dev
接下来,重新编译:
make clean && make
运行示例:
./mnistCUDNN
结果如下,表明安装成功:
(二)卸载
1. cuda卸载
如果能找到cuda-uninstaller:
nvcc --version #此时显示版本号
cd /usr/local/cuda-11.8/bin
sudo ./cuda-uninstaller # 全选-->done
nvcc -version #此时显示No such file or directory
如果找不到cuda-uninstaller:
sudo apt-get remove cuda
sudo apt autoremove
sudo apt-get remove cuda*
(执行完以上命令后,剩余安装包已同时删除,如果没有执行下面命令)
程序卸载后会剩余安装包,所以cd到安装目录下:
cd /usr/local/
删除原有的cuda文件夹
sudo rm -r cuda-11.8
这样的话可能会有残留文件,通过以下命令查找和删除残留:
查看剩余残留:
sudo dpkg -l |grep cuda
卸载对应的残留 :
sudo dpkg -P cuda-visual-tools-11-6
所有的查询到的残留都要删除~~
sudo dpkg -P 残留文件全称
2. cuDNN卸载
sudo dpkg -l | grep cudnn #查看现存cudnn文件
#按顺序执行三个包
sudo dpkg -r libcudnn8-samples
sudo dpkg -r libcudnn8-dev
sudo dpkg -r libcudnn8
sudo dpkg -l | grep cudnn #查看现存cudnn文件
# 结果如下
ii cudnn-local-repo-ubuntu2004-8.5.0.96 1.0-1 amd64 cudnn-local repository configuration files
#这个包和上述三个的删除不一样,需要执行以下语句删除:
sudo apt-get purge cudnn-local-repo-ubuntu2004-8.5.0.96
#再次查看还有什么cudnn存在
sudo dpkg -l | grep cudnn
#没有输出即为卸载成功
3. Nvidia驱动卸载
一般驱动卸载后,需要重装,可以参考下面连接的方法二、方法三:
『heqingchun-ubuntu系统下安装nvidia显卡驱动3种方法』_ubuntu安装nvidia显卡驱动-CSDN博客
涉及卸载的命令如下:
sudo apt remove --purge nvidia*
sudo apt autoremove
或者尝试如下方法:
显卡驱动卸载:先进入文本模式Ctrl+Alt+F2(F3到F6)都可以(Ctrl+Alt+F7返回图形窗口)
先卸载显卡驱动:sudo apt-get remove nvidia-*
再清除无用的包:sudo apt-get autoremove
再次尝试卸载:sudo nvidia-unustal
重启电脑: sudo apt reboot