报错1:
nvidia-smi
Command 'nvidia-smi' not found, but can be installed with:xxx
原因:
之前是好的,突然又不好了,显卡驱动的问题,重装显卡驱动。
报错2:
nvidia-smi
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.
原因:
由于重启过服务器,Linux内核升级导致。Linux内核升级,导致之前的Nvidia驱动不匹配连接。
解决方法1:(都尝试一下指不定哪个能成)
删除现有驱动:
sudo apt-get remove --purge nvidia-*
打开"应用程序-软件和更新-附加驱动"根据你的显卡型号选择相应的版本安装:
解决方法2:
安装dkms:
sudo apt-get install dkms
使用dkms重新安装适合驱动:
sudo dkms install -m nvidia -v 470.xxx.xx
dkms status nvidia
解决方法3:
安装驱动
step1:更新软件包存储库:
sudo apt update
sudo apt upgrade
step2:搜索可用驱动:
apt search nvidia-driver
step3:从可用 GPU 驱动程序列表中选择要安装的驱动程序
sudo apt install nvidia-driver-470
step4:重启计算机
sudo reboot
重新启动之后,nvidia-smi就成功显示了