1)报错详情:
# 重启服务器后, grub默认使用最新版本内核,导致 nvidia-smi 报错 NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.
2)解决办法:
修改grub默认内核为原版本内核
- Step1. 查看内核日志,寻找之前版本及新安装的版本
sudo grep generic /var/log/* | le
## 确认之前版本为:5.4.0-40
## 目前更新后的版本为:5.4.0-42
- Step2. 查看内核启动顺序 ,可以看到默认5.4.0-42版本为排在最前面
grep menuentry /boot/grub/grub.cfg
- Step3. 更改grub启动,固定每次启动后默认使用的内核版本:
sudo vim /etc/default/grub
## 找到 GRUB_DEFAULT=0,更改为下面的命令:
GRUB_DEFAULT="Advanced options for Ubuntu>Ubuntu, with Linux 5.4.0-40-generic"
- Step4.更新grub
sudo update-grub
- Step5.重启 ,重新运行nvidia-smi
reboot
等待重启,重启成功后重新nvidia-smi