问题:服务器重启之后nvidia-smi无法使用,GPU也无法使用
具体报错信息如下:
Impossible to initialize nvidia nvml : Driver Not Loaded
问题出在cuda驱动在重启之后可能进行了更新,导致无法匹配
首先先把重启更新驱动这个设定关闭:
-
sudo vim /etc/apt/apt.conf.d/50unattended-upgrades
-
把这两行注释掉
-
sudo reboot
重启一下试试,如果重启后可以正常用了那可太好了
否则就只能重新安装驱动了(sad555)
-
首先先卸载之前nvidia相关的驱动
sudo apt-get purge nvidia* sudo apt-get autoremove
-
添加nvidia源
sudo add-apt-repository ppa:graphics-drivers/ppa
-
直接用推荐驱动版本安装
sudo ubuntu-drivers autoinstall
-
最后再重启一次就可以了
除此之外还有些信息你可能用得上:
- 查看本地已安装显卡驱动:
dpkg -l | grep nvidia
- 查看本地使用的具体显卡驱动版本信息:
cat /proc/driver/nvidia/version