环境
系统版本:Ubuntu-22.04.01
内核版本:linux-image-6.5.0-25-generic
驱动版本:550.54.14
问题
计划在电脑上安装cuda, 然后提示更新驱动,于是卸载了已有的驱动。之后尝试了各种方式安装nvidia驱动,最终测试都会报如下错误:
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver.
Make sure that the latest NVIDIA driver is installed and running.
该错误是系统内核没有正确加载nvidia驱动的内核模块。
- 原因1:内核版本与驱动版本不匹配。默认状态下,系统会自动更新内核,可能会导致之前安装的驱动不可用。解决办法可以参考这篇文章。
- 原因2:内核开启了secure boot, 导致无法正常加载nvidia的驱动。关闭secure boot即可,具体做法可以参照这篇文章 。
最后通过第二种方式解决问题。
附录
nvidia驱动安装
- 方式1:在系统软件software&update中安装(推荐),可能需要先手动卸载旧版驱动。
- 方式2:使用命令行安装。
sudo apt install nvidia-driver-550
- 方式3:手动下载安装。参考链接
nvidia驱动卸载
sudo apt remove nvidia-*