一、问题描述
更新软件之后,再调用nvidia-smi
出现下面的问题
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.
二、问题分析
可能是因为更新了部分内核,导致不匹配或者驱动掉了。
三、解决方案
3.1 方案一:重新安装驱动
- 1、卸载
sudo apt-get --purge remove nvidia*
sudo apt autoremove
- 2、安装
1)自动安装
sudo ubuntu-drivers autoinstall
2)手动安装
ubuntu-drivers devices
sudo apt install nvidia-driver-535
经过本人实测,该问题还是会出现
3.2 方案二:
sudo apt-get install dkms
sudo dkms install -m nvidia -v 535.80
# 版本号 可以通过下面的命令查到
# ls /usr/src | grep nvidia
经过本人实测,该问题还是会出现
3.3 方案三 加载驱动模块
sudo modprobe nvidia
- 可能会出现下面的问题:
modprobe error: could not insert ‘nvidia’: Operation not permitted
- 解决方案:
我们进入BIOS 把secure boot
选项关掉即可。
secure boot 大概的作用时为了保护内核的启动安全;
linux secure boot 状态查询:mokutil --sb-state