1. 问题
安装cuda和驱动程序,执行nvidia-smi是正常的,可运行,但是过了段时间电脑重启,发现屏幕扩展失效了,又发现nvidia-smi也失效了,就是提示类似下面的错误
执行nvcc-v, 看cuda是否正常:
查看显卡驱动是否存在:
通过上面得到的信息和网络查询的问题,基本上确定是因为重启电脑导致的内核升级而驱动程序不匹配导致的,这里主要讲述如何最快的解决该问题,参考的资料是:NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver - 简书
2. 解决方法
这里只介绍一种通过dkms工具快速解决该驱动不匹配的问题,因为还有其他很多方法。
dkms专门是维护内核外的驱动程序的,详细可了解 DKMS简介_fouweng的博客-CSDN博客_dkms
(1)首先安装dkms
sudo apt install dkms
(2) 用dkms维护驱动
然后看到上述的信息,就确定已安装成功,然后再执行nvidia-smi就出现下面正常的样子。
其他解决思路:
就是内核换成升级之前的内核即可。