1.报错如下
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.
2. nvcc -v 查看cuda库是存在的
3.查看NVIDIA显卡驱动是否安装了,发现系统中存在nvidia驱动,但是没有加载
4.安装dkms,用来动态加载驱动, 450.57是上面显示的版本号
#先安装dkms,是ubuntu驱动管理器
sudo apt-get install dkms
#如果下面的命令执行后显示不存在这个版本,-v 后的版本号具体到第三个逗号之后
sudo dkms install -m nvidia -v 450.57
5.
6.查看驱动是否加载
7. DKMS的解释
Oikawa等人在1996年提出一种与LKM类似的动态核心模块(DKMs)技术。与LKM一样,DKMs以文件的形式存储并能在系统运行过程中动态地加载和卸载。DKMs由一个用户层的DKM服务器来管理,并非由内核来管理。当核心需要某模块时,由DKM服务器负责把相应的DKM加载;当核心的内存资源紧缺时,由DKM服务器负责卸载一个没有被使用的DKM。
8.总结
原因是我在跑深度学习代码的时候,调用了别人的代码,里面有调用CUDA的指令,如果当前的显卡和驱动版本算力不匹配的时候,就会出现这中情况。
参考;