nvidia-smi 出大问题了。
遇到 Failed to initialize NVML: Driver/library version mismatch
错误,通常是因为 NVIDIA 驱动版本与内核模块版本不匹配。以下是逐步排查和解决方法:
1. 原因分析
-
驱动未完全更新:更新驱动后未重启系统,旧版本的内核模块仍在运行。
-
多版本驱动冲突:系统中安装了多个版本的 NVIDIA 驱动,导致版本冲突。
-
内核更新未同步:系统内核升级后,NVIDIA 驱动未重新编译适配。
2. 解决步骤
(1) 检查驱动版本
运行以下命令查看当前安装的驱动版本:
nvidia-smi
如果报错,继续下一步。
(2) 查看内核模块版本
cat /proc/driver/nvidia/version
输出示例:
NVRM version: NVIDIA UNIX x86_64 Kern