nvidia-smi报错:
NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.
最近我重度使用笔记本电脑,几乎每天都在Ubuntu系统训练模型,笔记本起码一周未关机。2024年5月17日中午,我查看笔记本,发现键盘失灵,关机重启后,又出现了上述问题(今年1月份也出现过),伴随的问题是外接显示屏无法显示。翻看之前的笔记,才想起了发生原因及解决办法,专门再次记录以便查阅。
原因:
ubuntu自动更新了内核版本(我之前就把取消了系统内核自动更新,为什么为这样我也搞不懂),导致原本的nvidia版本不匹配,要想使驱动恢复正常,要么降低内核版本,要么升级驱动版本。该问题伴随双屏问题,致使我只能使用单屏,报错原因显示hdmi接口错误。驱动问题解决后 ,该问题也随之解决。
解决方法:
更新驱动较为方便。
之前的内核为5.15.0-91-generic、5.15.0-89-generic。通过命令uname -r 查看当前内核为5.15.0-107-generic。
升级驱动版本步骤:
sudo apt-get purge nvidia-* #卸载原版本驱动
sudo apt update #更新软件包索引
ubuntu-drivers devices # 检测n卡的可选驱动
sudo apt install nvidia-driver-550 # 之前是545,在可选驱动中,选择550
reboot# 重启
nvidia-smi # 查询驱动状态 不报错则驱动、显示屏问题都解决了