分类 | 详情 |
---|---|
问题描述 | 执行nvidia-smi命令报【Failed to initialize NVML: Driver/library version mismatch】 |
问题原因 | 系统自动升级过显卡驱动,在显卡驱动支持的系统内核版本相同的情况下,某些应用占用显卡,导致无法更新驱动的内核模块,进而无法使用 |
问题影响 | 使用显卡的应用,无法进行运算处理 |
排查过程 | 提示:在百度上查询该错误,基本上都是驱动版本和内核版本不一致导致的,并不完全准确,但排查的思路可取 这篇文章还不错:【nvidia】1.命令行方式安装nvidia显卡驱动_牛andmore牛的博客-CSDN博客_命令行安装显卡驱动 # 1.查看当前显卡当前使用的驱动版本 # 2.查看显卡驱动是否更新 结论:升级驱动70.103.01到470.129.06,升级前后的内核版本都是0ubuntu0.20.04.1 # 3.查看系统的内核版本 结论:系统使用的内核是20.04.1-Ubuntu,和显卡驱动支持的内核版本一致 到这里基本上就能确认上述的问题原因了。 辅助排查的命令: # 查看系统的nvidia驱动版本 # 查看驱动的完整版本号 # 查看驱动程序支持的内核版本 Ubuntu常用包管理命令:Ubuntu包管理工具整理 - weaming - 博客园 |
解决办法 | 方法一:查看所有使用显卡的应用,并停掉,然后再卸载内核模块,重新进行加载,比较麻烦,卸载和加载模块可参考:Failed to initialize NVML: Driver/library version mismatch. # 1.查看哪些应用占用显卡 # 2.查看显卡的内核模块 方法二:重启系统,简单直接 |
优化项 | 1.禁用显卡自动更新:apt-mark hold nvidia-driver-470 2.如果是显卡和内核模块不匹配,就需要先卸载当前驱动,再重新安装,重启系统,可参考:Ubuntu中Failed to initialize NVML: Driver/library version mismatch问题的解决 - 灰信网(软件开发博客聚合) |
执行nvidia-smi命令报Failed to initialize NVML: Driver/library version mismatch错误
于 2022-05-27 15:17:59 首次发布