Ubuntu内核自动升级会导致nvidia-smi失败,显卡驱动与内核版本不匹配。解决的两种思路,一是内核版本降级,二是更换与内核版本匹配的驱动。
一没有实验成功(可能是配置错误),所以按照二执行,参照网上大神的步骤,简单做一个 记录,以备后续遇到使用。
问题:
xxx@ubuntu: ~$ nvidia-smi
NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.
解决:
进入/usr/src看到nvidia-418.xxx.xx文件夹,说明nvidia驱动版本是418.xxx.xx。根据网上的办法,使用以下命令:
1) sudo apt-get install dkms
2)sudo dkms install -m nvidia -v 418.xxx.xx(NVIDIA版本号)
如果报错,出现错误提示:
Bad return status for module build on kernel: 5.4.0-42-generic on Ubuntu18.04. NVIDIA-SMI failed.
Linux内核版本是5.4.0-42-generic,这个内核版本网上也说与许多版本驱动匹配,需要升级到440版本的NVIDIA驱动。
执行下面步骤安装更高版本的驱动。
3)sudo apt-get autoremove --purge nvidia-*