问题描述
nvidia-smi
问题根源
NVIDIA 内核驱动版本与系统驱动不一致
解决方案
卸载服务器驱动,重新安装于 nvidia 内核版本匹配的驱动。
输入下条命令,查看你的显卡驱动所使用的内核版本
cat /proc/driver/nvidia/version
输入下条命令,查看服务器驱动
cat /var/log/dpkg.log | grep nvidia
(假装有图)
可以看到两个驱动不匹配。
这时候我们需要卸载原来的驱动,安装匹配的驱动。
输入命令
sudo apt install nvidia-driver-470
其中 470 换成匹配的版本,这个命令会自动卸载现在的驱动并且下载安装指定的驱动。
然后重启即可。
sudo reboot
如果不重启的话会出现错误:NVIDIA-SMI couldn’t find libnvidia-ml.so library in your system. Please make sure that the NVIDIA Display Driver is properly installed and present in your system.
Please also try adding directory that contains libnvidia-ml.so to your system PATH.
所以必须要重启。
参考链接
How to Install Nvidia Drivers on Ubuntu 20.04
Ubuntu中Failed to initialize NVML: Driver/library version mismatch问题的解决