前言
最近给服务器搬了个家,搬完之后nvidia驱动就挂了。nvidia-smi命令用不了,提示如下错误:
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver.
一直以为要重新安装CUDA,后来上网搜了一下,发现dkms就可以解决。
解决方法和步骤
- 确定CUDA可用
# 查看CUDA版本
nvcc -V
# 如果可以正常输出版本信息,则说明CUDA可用
- 安装dkms
# 使用以下命令
sudo apt-get install dkms
- 查看nvidia版本
# 使用以下命令
whereis nvidia
# 这里会输出一个含有版本号的路径,记住这个