具体症状表现为:
1 . 显示驱动已安装
2 . 输入 nvidia-smi
,报如下错误:
NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.
3 . 在跑深度学习网络时,也显示找不到GPU
操作方式:
方案一:在BIOS界面,禁用secure boot,也就是设置为disable
本人结果:在BIOS界面,早已设置secure boot为disable,并没有解决问题。各位可以先尝试。
方案二:内核版本太高的问题,选择低版本的ubuntu系统进入
开机grub界面是:
第一行默认是高版本的,选择第二行Advanced options for Ubuntu
然后再选择低版本的系统。
注:终端输入uname -r
可以查看当前内核版本
本人结果:在低版本依旧无法解决问题。各位可以先尝试。
方案三:安装对应的驱动模块
查看对应驱动版本
cd /usr/src
ls
然后安装DKMS(Dynamic Kernel ModuleSupport):
sudo apt-get install dkms
重新安装对应nvidia的驱动模块(根据个人实际的版本号填写)
sudo dkms install -m nvidia -v srv-460.73.01
理论上成功就好了。
然而,我遇到报错:
ERROR: Cannot create report: [Errno 17] File exists: ‘/var/crash/nvidia-dkms-460-server.0.crash’
Error! Bad return status for module build on kernel: 4.15.0-140-generic (x86_64)
Consult /var/lib/dkms/nvidia/srv-460.73.01/build/make.log for more information.
解决方式:重新下载gcc
sudo apt install gcc-8
sudo update-alternatives --config gcc
sudo update-alternatives --remove-all gcc
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-8 10
sudo update-alternatives --install /usr/bin/cc cc /usr/bin/gcc-8 10
随后,问题解决,安装成功nvidia -v srv-460.73.01
然后输入nvidia-smi
,成功!
参考文章:
https://blog.csdn.net/sazass/article/details/86747733
https://blog.csdn.net/JerryZhang__/article/details/108865176
https://blog.csdn.net/smcaa/article/details/86482872
https://blog.csdn.net/sinat_23619409/article/details/85220561
https://blog.csdn.net/missyoudaisy/article/details/104432746