【已解决】Failed to initialize NVML: Driver/library version mismatch NVML library version: 535.161

问题描述

        今天遇到这样一个问题:Failed to initialize NVML: Driver/library version mismatch NVML library version: 535.161

原因分析和解决

        其实这种问题一般都是系统检测到驱动和cuda版本不一致的原因导致的,这也就是在我们用update操作时会有这样的问题:

sudo apt-get update  --  从服务器获取软件列表,并在本地保存为文件。
sudo apt-get upgrade  --  本地安装软件与本地软件列表对比,如本地安装版本低,会提示更新。

        在 linux中,安装软件最常用到的是 sudo apt-get ,这个命令会从软件仓库中检索并拉取我们想要的软件。 我就是使用的第一条命令。

        查看我的升级日志,发现最近确实有升级的记录,那就很明显了。

(base) visionx@visionx:~$ cat /var/log/dpkg.log |grep nvidia|grep libnvidia-common
2024-04-09 06:50:34 upgrade libnvidia-common-525:all 525.147.05-0ubuntu0.20.04.1 525.147.05-0ubuntu2.20.04.1
2024-04-09 06:50:34 status half-configured libnvidia-common-525:all 525.147.05-0ubuntu0.20.04.1
2024-04-09 06:50:34 status unpacked libnvidia-common-525:all 525.147.05-0ubuntu0.20.04.1
2024-04-09 06:50:34 status half-installed libnvidia-common-525:all 525.147.05-0ubuntu0.20.04.1
2024-04-09 06:50:35 status unpacked libnvidia-common-525:all 525.147.05-0ubuntu2.20.04.1
2024-04-09 06:50:35 install libnvidia-common-535:all <无> 535.161.07-0ubuntu0.20.04.1
2024-04-09 06:50:35 status half-installed libnvidia-common-535:all 535.161.07-0ubuntu0.20.04.1
2024-04-09 06:50:35 status unpacked libnvidia-common-535:all 535.161.07-0ubuntu0.20.04.1
2024-04-09 06:50:35 upgrade libnvidia-common-520:all 525.147.05-0ubuntu0.20.04.1 525.147.05-0ubuntu2.20.04.1
2024-04-09 06:50:35 status half-configured libnvidia-common-520:all 525.147.05-0ubuntu0.20.04.1
2024-04-09 06:50:35 status unpacked libnvidia-common-520:all 525.147.05-0ubuntu0.20.04.1
2024-04-09 06:50:35 status half-installed libnvidia-common-520:all 525.147.05-0ubuntu0.20.04.1
2024-04-09 06:50:36 status unpacked libnvidia-common-520:all 525.147.05-0ubuntu2.20.04.1
2024-04-09 06:50:36 configure libnvidia-common-535:all 535.161.07-0ubuntu0.20.04.1 <无>
2024-04-09 06:50:36 status unpacked libnvidia-common-535:all 535.161.07-0ubuntu0.20.04.1
2024-04-09 06:50:36 status half-configured libnvidia-common-535:all 535.161.07-0ubuntu0.20.04.1
2024-04-09 06:50:36 status installed libnvidia-common-535:all 535.161.07-0ubuntu0.20.04.1
2024-04-09 06:50:36 configure libnvidia-common-520:all 525.147.05-0ubuntu2.20.04.1 <无>
2024-04-09 06:50:36 status unpacked libnvidia-common-520:all 525.147.05-0ubuntu2.20.04.1
2024-04-09 06:50:36 status half-configured libnvidia-common-520:all 525.147.05-0ubuntu2.20.04.1
2024-04-09 06:50:36 status installed libnvidia-common-520:all 525.147.05-0ubuntu2.20.04.1
2024-04-09 06:50:36 configure libnvidia-common-525:all 525.147.05-0ubuntu2.20.04.1 <无>
2024-04-09 06:50:36 status unpacked libnvidia-common-525:all 525.147.05-0ubuntu2.20.04.1
2024-04-09 06:50:36 status half-configured libnvidia-common-525:all 525.147.05-0ubuntu2.20.04.1
2024-04-09 06:50:36 status installed libnvidia-common-525:all 525.147.05-0ubuntu2.20.04.1
2024-04-09 06:57:54 status installed libnvidia-common-525:all 525.147.05-0ubuntu2.20.04.1
2024-04-09 06:57:54 remove libnvidia-common-525:all 525.147.05-0ubuntu2.20.04.1 <无>
2024-04-09 06:57:54 status half-configured libnvidia-common-525:all 525.147.05-0ubuntu2.20.04.1
2024-04-09 06:57:54 status half-installed libnvidia-common-525:all 525.147.05-0ubuntu2.20.04.1
2024-04-09 06:57:54 status config-files libnvidia-common-525:all 525.147.05-0ubuntu2.20.04.1
2024-04-09 06:57:55 status not-installed libnvidia-common-525:all <无>

        当我把这个问题喂给chatgpt的时候,她给了我这样的答复:

这个错误通常是因为 NVIDIA 驱动与 NVML 库版本不匹配所致。解决此问题的一种方法是更新或回滚 NVIDIA 驱动程序,以使其与当前安装的 NVML 库版本匹配。

首先,您可以尝试更新 NVIDIA 驱动程序到与 NVML 库版本匹配的最新版本。您可以从 NVIDIA 官方网站下载最新的驱动程序,并确保它与您当前的 NVML 库版本兼容。

如果更新驱动程序不起作用,您还可以尝试降级 NVML 库版本,使其与当前安装的 NVIDIA 驱动程序兼容。您可以从 NVIDIA Developer 网站下载适用于您的系统的 NVML 库的旧版本,并将其安装到您的系统中。

如果以上方法都不起作用,您可能需要进一步检查系统中的其他配置或依赖项,以确保 NVIDIA 驱动程序与 NVML 库版本匹配,并且系统设置正确。您还可以考虑重新安装 NVIDIA 驱动程序和 NVML 库,以解决潜在的安装问题。

        而我在互联网冲浪时也得到了类似的答复 

        并且给出的解决办法是这样的:

        解决办法一、更新驱动

1.卸载驱动

sudo apt-get purge nvidia*

2.查找可用的驱动版本

ubuntu-drivers devices

        查找本机内核版本:

cat /proc/driver/nvidia/version

        发现为440.33.01

        于是尝试安装440版本的驱动:

sudo apt-get install nvidia-driver-440 nvidia-settings nvidia-prime

        然而安装失败,某些包不匹配,系统解决不了错误,卡了一会时间。

        最终尝试安装415版本的,安装成功了

sudo apt-get install nvidia-driver-415 nvidia-settings nvidia-prime

        当然还有人这么建议,相当哇塞!!! 

        解决办法二、重启

        这个方法在我的实战经历中我发现,凡是cuda和driver不一样的情况下大多数都可以

        解决办法三、其他方法 

        这种方法还是挺好想的,但是我确实没想到哦,让我们感谢质数哥!

我尝试了几种思路:
1.最简单的是重启,貌似能解决;
2.重启不能解决就换重新安装了,后来就把一个固定的driver安装文件保存在本地,出了问题就重新sudo安装,好像也行,就是折腾;
3.固定版本,这个我试过,好像不咋好用;
4.设置驱动不更新,这个到目前为止还没出现问题。

上面4个方法是我都一一尝试过的,我用的系统是ubuntu的,具体方法也都是在知乎和csdn找的。

作者链接:质数 - 知乎

        当然除了质数哥给的方法,还有其他的  

        终极方法:关闭自动更新 

相关链接

        nvidia-smi指令报错:Failed to initialize NVML: Driver解决 - 知乎分配的新电脑,ubuntu18.04系统,nvidia的驱动都装好了,但是使用指令: nvidia-smi报错: Failed to initialize NVML: Driver/library version mismatch安装gpustat也显示找不到gpu,且cuda,深度学习gpu均不行 …icon-default.png?t=N7T8https://zhuanlan.zhihu.com/p/94378201
解决nvidia-smi “Failed to initialize NVML: Driver/library version mismatch”_nvml library version: 535.154-CSDN博客文章浏览阅读1.4k次,点赞3次,收藏10次。根据网上类似问题的线索,大概率是自动升级后library立即更新,而driver由于是kernal module不会自动运行新版本导致两者不匹配。今天发现有如下错误。什么也不需要做,reboot 后 driver version 就更新了。在下文可以看到reboot后driver已更新到。原来的设定如下,我把。这个问题还是挺常见的,在此主要记录一下我遇到的具体情况。不是工作时段,很可能是自动完成的。已经安装了,只是运行的还是旧版本。都改了,不知道是否管用。,和NVML保持一致了。这里不是很确定是否正确。_nvml library version: 535.154https://blog.csdn.net/jingjm00/article/details/135865160

完结撒花

        我为什么要教阿三哥使用筷子呢?

  • 48
    点赞
  • 51
    收藏
    觉得还不错? 一键收藏
  • 11
    评论
根据引用的内容,当执行nvidia-smi指令时,可能会出现"Failed to initialize NVML: Driver/library version mismatch"错误。这个错误意味着显卡的驱动程序和内核版本不匹配。这个问题可能是由于系统自动更新驱动程序导致的,而不是人为因素引起的。 虽然有人建议通过重启服务器来解决这个问题,但由于服务器是在实验室中使用的,可能无法进行重启。不过,有一种方法可以解决这个问题而不需要重启服务器。在这种方法中,我们可以使用以下步骤来解决"Failed to initialize NVML: Driver/library version mismatch"错误: 1. 首先,打开终端并输入以下命令以查看当前可用的Nvidia驱动程序版本: ``` nvidia-smi ``` 这将显示当前安装的驱动程序版本和相关信息。 2. 然后,下载并安装与当前内核版本匹配的适当的Nvidia驱动程序。你可以从Nvidia官方网站或其他可靠来源下载适当版本的驱动程序。 3. 安装驱动程序后,重启计算机以使更改生效。 4. 重新打开终端并再次运行以下命令以验证驱动程序是否成功安装并与内核版本匹配: ``` nvidia-smi ``` 通过执行以上步骤,你应该能够解决"Failed to initialize NVML: Driver/library version mismatch"错误,并使显卡驱动程序与内核版本保持匹配。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [Failed to initialize NVML: Driver/library version mismatch](https://blog.csdn.net/weixin_43568307/article/details/128187469)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *2* *3* [【nvidia-smi】Failed to initialize NVML: Driver/library version mismatch解决方法(不用重启)](https://blog.csdn.net/qq_48081868/article/details/122349627)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 11
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值