问题描述: 执行nvidia-smi的时候, 出现下述报错,
原因分析: 因为刚安装了一个驱动, 原先的nvidia module没有卸载, 导致新的驱动模块加载不了.
解决办法: 重启, 或者卸载原先加载的驱动
# 卸载加载的nvidia驱动
sudo rmmod nvidia_drm
sudo rmmod nvidia_uvm
sudo rmmod nvidia_modeset
sudo rmmod nvidia
# 再执行nvidia-smi就好了
如果卸载某个mod的时候, 遇到错误, 比如
就找到使用这个模块的程序, 然后kill掉再进行卸载
sudo lsof /dev/nvidia*
示例输出
直接sudo kill 37667
即可.
参考链接:
- https://stackoverflow.com/questions/43022843/nvidia-nvml-driver-library-version-mismatch