问题: nvidia-smi显示NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.
原因:系统内核和显卡驱动不匹配
解决方案:
1.uname -a 查询当前系统内核,可知内核版本:5.15.0-67-generic(图片显示的是问题解决后的版本号)
2. ls /var/lib/dkms/nvidia/ 查询显卡驱动对应的内核驱动。所需内核版本:5.15.0-116-generic
发现是一致的,是因为我已经解决,所以一致。
3. grep menuentry /boot/grub/grub.cfg 查询系统存在的内核版本,可知存在Linux 5.15.0-67-generic 和 5.15.0-116-generic两个内核驱动,步骤2需要5.15.0-116-generic,所以要把内核驱动设置为5.15.0-116-generic
4.sudo vim /etc/default/grub 修改驱动内核,编辑grub文件 ,修改为“1>0”,步骤3中的红色框是1,选择蓝色框 0,即是“1>0”的来由。如果存在更多的内核,同理选择。
5.sudo update-grub 更新grub,然后重启使用nvidia-smi测试是否解决问题。