之前在安装系统的时候选择了闭源驱动,以为那样操作之后就万事大吉了,后面如果要安装cuda啥的直接装就行。然而万万没想到还是想简单了,官方提供的闭源驱动版本不完整,这直接导致哪怕装上了cuda,也无法正常运行程序(不要问我为什么知道的,我那可怜的两天时间一去不复返。不过看到有人说用conda是可以的,这样深度学习炼丹师可能还能试试)。。。。什么破玩意!!!
哎,往事不堪回首,虽然差点就装回了ubuntu,但坚强的我经历一番折腾还是把环境弄好了。
下面介绍下Deepin v20系统CUDA11和cudnn磨人的安装过程。
驱动安装
1.下载run文件:https://www.nvidia.cn/Download/index.aspx?lang=cn
2.禁止nouveau驱动(即便之前选择了闭源驱动安装,也要设置)
sudo deepin-editor /etc/modprobe.d/blacklist.conf
在打开的blacklist.conf文件中写入以下内容并保存关闭
blacklist nouveau
options nouveau modeset=0
给blacklist.conf可以执行的权限:
sudo chmod +x /etc/modprobe.d/blacklist.conf
blacklist nouveau是禁用nouveau第三方驱动的意思,执行下面命令使其生效:
sudo update-initramfs -u
3.安装显卡驱动,按“CTRL+ALT+F2”进入tty2
如果之前系统安装了闭源驱动,则先把它卸载了:
sudo apt-get remove "nvidia-*"
安装:
sudo service lightdm stop
sudo ./NVIDI**.run
reboot
重启后输入nvidia-smi,如果打出了显卡信息,则说明驱动安装完成了。
CUDA安装
查看下载安装命令:https://developer.nvidia.com/zh-cn/cuda-downloads
wget https://developer.download.nvidia.com/compute/cuda/11.1.0/local_installers/cuda_11.1.0_455.23.05_linux.run
sudo sh cuda_11.1.0_455.23.05_linux.run --silent --toolkit --samples --librarypath=/usr/local/cuda
查看是否安装成功:
cd /home/xxx/NVIDIA_CUDA-11.1_Samples/1_Utilities/deviceQuery
make
./deviceQuery
如果输出pass则OK了。(如果没有安装驱动而是使用deepin自动的闭源驱动,这一步会失败。哎,深之度还有很长的路要走啊!!!)
安装完成之后把cuda添加到环境变量中:
sudo gedit ~/.zshrc
在文件最后添加:
CUDA_HOME=/usr/local/cuda/
export PATH=$PATH:$CUDA_HOME/bin/
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$CUDA_HOME/lib64
生效:
source ~/.zshrc
这样就把cuda完整地装上了。
查看安装结果
nvcc -V
CUDNN安装
下载文件:cuDNN Library for Linux (x86_64)
直接安装
tar -zvxf cudnn-9.0-linux-x64-v7.tgz
cd cuda
sudo cp -P lib64/* /usr/local/cuda/lib64/
sudo cp -P include/* /usr/local/cuda/include/
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
这样就安装完成了。
下面附上卸载的相关操作,以供悲剧的时候查看,希望我你永远也不要用上。
卸载驱动
ctr+alt+F2
sudo apt-get remove "nvidia-*"
卸载cuda
sudo /usr/local/cuda-11.1/bin/cuda-uninstaller