显卡驱动安装
注意事项
1.nvidia驱动,cuda,cudnn三者的版本是相互对应的,必须要确保版本匹配
2.caffe等库安装时对新版本的cuda11.0+可能不支持,目前建议安装cuda10.0版本及其对应的驱动,注意,如果直接安装了cuda11.0+,后面编译caffe出问题需要全部卸载重装
ubuntu安装NVIDIA驱动.
nvidia驱动下载官网
1. 安装驱动
#查看显卡情况
lspci -k | grep -A 2 -E "(VGA|3D)"
sudo apt-get update #更新软件列表
sudo apt-get install g++ #安装必要依赖
sudo apt-get install gcc
sudo apt-get install cmake
sudo apt-get remove --purge nvidia* #卸载原有所有驱动(或者nviida-*)
sudo gedit /etc/modprobe.d/blacklist.conf #禁用nouveau,末尾添加如下两行命令保存
blacklist nouveau
options nouveau modeset=0
sudo update-initramfs -u #更新
reboot #重启电脑
lsmod | grep nouveau #检查,输入之后无其他输出,成功,继续
sudo telinit 3 #进入文本界面
sudo service gdm3 stop #停止显示服务
sudo chmod 777 NVIDIA-Linux-x86_64-430.26.run #给你下载的驱动赋予可执行权限,才可以安装
sudo ./NVIDIA-Linux-x86_64-430.26.run –no-x-check –no-nouveau-check –no-opengl-files #安装
sudo service gdm3 start #重启显示服务,完成
reboot #有独显直连要在安装完成后打开
中间一些步骤
1.The distribution-provided pre-install script failed! Are you sure you want to continue?
选择continue installation
2.Would you like to register the kernel module souces with DKMS? This will allow DKMS to automatically build a new module, if you install a different kernel later?
选择 No 继续。
3.问题没记住,选项是:install without signing,遇到签名问题就是bios安全模式没有关闭
4.问题大概是:Nvidia's 32-bit compatibility libraries? 选择 No 继续。
5.Would you like to run the nvidia-xconfigutility to automatically update your x configuration so that the NVIDIA x driver will be used when you restart x? Any pre-existing x confile will be backed up.
选择 Yes 继续
如果不禁用开源驱动会出现开机黑屏,可以开机进入恢复模式,在root模式下输入 sudo apt remove --purge nvidia* ,在reboot重启就好了,然后按照这个链接的办法,复杂的方式安装。
安装完成后如果出现外接显示器可以显示,内置的显示器不能显示的情况,可以如下方式解决:
sudo rm /etc/X11/xorg.conf
sudo reboot
2. step2 安装cuda
-
上一步的nvidia-smi已经可以看到cuda版本,这里的版本是向下兼容的。这里我们需要去官网下载对应版本并安装;
-
基本上下载下来按照官网步骤走就可以,注意安装方式尽量用runfile的,注意前面已经安装过显卡驱动,这里提示安装驱动时选择no,或者如下界面不要选择驱动。其他相关都要安装,路径直接回车安装在默认位置就可以;
-
UDA Installer │
│ - [ ] Driver │
│ [ ] 460.27.04 │
│ + [X] CUDA Toolkit 11.2 │
│ [X] CUDA Samples 11.2 │
│ [X] CUDA Demo Suite 11.2 │
│ [X] CUDA Documentation 11.2 -
网络好的话,建议使用runfile安装方式
-
安装结束后添加环境变量
sudo gedit ~/.bashrc
打开后输入,注意改成自己的版本
export PATH=/usr/local/cuda-10.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
执行以下命令可以看到cuda版本
nvcc -V
还不放心可以测试以下例子
cd /usr/local/cuda-10.0/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery
运行后出现相关版本设备信息,且Result = PASS说明没问题了。
step2 安装cudnn
- 下载cudnn需要注册nvidia账号,然后下载对应cuda版本的cudnn;
这个官网链接中可以查看合适的版本并下载 https://developer.nvidia.com/rdp/cudnn-archive,需要注意的是,如果要装caffe框架,建议不要下载v8版本以上太新的,并不支持。
新版的cudnn使用deb安装方式 官方教程
通过deb安装的cudnn在添加公钥后需要运行
sudo dpkg -i cudnn-local-repo-$distro-8.x.x.x_1.0-1_amd64.deb
or
sudo dpkg -i cudnn-local-repo-$distro-8.x.x.x_1.0-1_arm64.deb
Where $distro is ubuntu1804, ubuntu2004, ubuntu2204, or debian11.
Import the CUDA GPG key.
sudo cp /var/cudnn-local-repo-*/cudnn-local-*-keyring.gpg /usr/share/keyrings/
Refresh the repository metadata.
sudo apt-get update
Install the runtime library.
sudo apt-get install libcudnn8
Install the developer library.
sudo apt-get install libcudnn8-dev
Install the code samples.
sudo apt-get install libcudnn8-samples
tar安装完可能出现如下类似的符号链接找不到,deb一般不会出现这个问题
/sbin/ldconfig.real: /usr/local/cuda-11.3/targets/x86_64-linux/lib/libcudnn_ops_train.so.8 is not a symbolic link
/sbin/ldconfig.real: /usr/local/cuda-11.3/targets/x86_64-linux/lib/libcudnn_cnn_infer.so.8 is not a symbolic link
/sbin/ldconfig.real: /usr/local/cuda-11.3/targets/x86_64-linux/lib/libcudnn_adv_train.so.8 is not a symbolic link
/sbin/ldconfig.real: /usr/local/cuda-11.3/targets/x86_64-linux/lib/libcudnn_adv_infer.so.8 is not a symbolic link
/sbin/ldconfig.real: /usr/local/cuda-11.3/targets/x86_64-linux/lib/libcudnn_cnn_train.so.8 is not a symbolic link
/sbin/ldconfig.real: /usr/local/cuda-11.3/targets/x86_64-linux/lib/libcudnn_ops_infer.so.8 is not a symbolic link
/sbin/ldconfig.real: /usr/local/cuda-11.3/targets/x86_64-linux/lib/libcudnn.so.8 is not a symbolic link
解决方法是,对每一个执行
sudo ln -sf /usr/local/cuda-11.3/targets/x86_64-linux/lib/libcudnn_ops_train.so.8.2.0 /usr/local/cuda-11.3/targets/x86_64-linux/lib/libcudnn_ops_train.so.8
sudo ldconfig
安装caffe
问题甚多,大致参考以下博客
https://blog.csdn.net/CAU_Ayao/article/details/83536320
只要nvidia驱动,cuda,cudnn的对应版本没问题且安装成功,通过各种百度总会解决的,也可以去github上直接搜索别人问过的