Ubuntu中Failed to initialize NVML: Driver/library version mismatch问题的解决
目录
问题描述
nvidia-smi
- 1
先重启一下看看,不行再往下
问题根源
NVIDIA 内核驱动版本与系统驱动不一致
解决方案
以下是我的解决方案,卸载电脑驱动,重装415版本与nvidia 内核版本匹配
输入下条命令,查看你的显卡驱动所使用的内核版本
cat /proc/driver/nvidia/version
- 1
可以看出Kernel Module 为415.27
输入下条命令,查看电脑驱动
cat /var/log/dpkg.log | grep nvidia
- 1
全部的内容较多,这里截取部分用作说明
可以看出,驱动由415升级为418
输入下条命令,查看电脑所有驱动
sudo dpkg --list | grep nvidia-*
- 1
nvidia有多个版本,其中有自动更新后的418版本,这也是电脑现在所使用的版本,但nvidia驱动只支持415版本(由第一个图可以看出),这也是问题产生的根源
输入下条命令,卸载电脑驱动
sudo apt-get purge nvidia*
- 1
输入下条命令,把显卡驱动加入ppa(个人软件包文档,仅支持Ubuntu),类似于应用商店
sudo add-apt-repository ppa:graphics-drivers
sudo apt-get update
- 1
- 2
输入下条命令,重装415版本驱动(大家可以安装适合自己nvidia驱动版本,确保版本号匹配即可)
sudo apt-get install nvidia-415 nvidia-settings nvidia-prime
-
执行udo apt-get install nvidia-415 nvidia-settings nvidia-prime命令的时候,为什么会出现E: Unable to locate package nvidia-415的情况
sudo apt-get install nvidia-415 nvidia-settings nvidia-prime这里改成sudo apt-get install nvidia-driver-415 nvidia-settings nvidia-prime
输入下条命令,查看解决方案是否生效
nvidia-smi
- 1
成功了
为防止再次出现这样的问题,可以禁用当前版本的本地更新,命令如下:
centos 7 安装nvidia-container-runtime_ace1231的博客-CSDN博客_nvidia-container-runtime 安装
sudo apt-mark hold nvidia-415