Failed to initialize NVML: Driver/library version mismatch 问题解决记录

本机环境:  lsb_release -a

Distributor ID: Ubuntu 
Description:    Ubuntu 22.04.2 LTS
Release:        22.04
Codename:       jammy

产生的原因是: 我使用 nvcc -V 时, 发现此命令不存在, 则安装之

使用命令安装

sudo apt install nvidia-cuda-toolkit

安装后, 导致 nvidia-smi命令报错  Failed to initialize NVML: Driver/library version mismatch

在网上看到很多都在讲 NVIDIA内核驱动版本和系统驱动不一致

那么我们关心的第一个问题就是 

NVIDIA内核驱动版本 是什么?

系统驱动是什么?

cat /proc/driver/nvidia/version文件,该文件应该包含驱动的版本信息

输出
NVRM version: NVIDIA UNIX x86_64 Kernel Module  530.30.02  Wed Feb 22 04:11:39 UTC 2023
GCC version:  gcc version 11.3.0 (Ubuntu 11.3.0-1ubuntu1~22.04)

安装 nvidia-driver-530 试试

sudo apt-get install nvidia-driver-530

安装后, 设备找不到了

No devices were found

安装 nvidia-driver-550 试试

sudo apt-get install nvidia-driver-550

nvidia-smi 开始报错

Failed to initialize NVML: Driver/library version mismatch
NVML library version: 550.107




cat /proc/driver/nvidia/version  报 535版本
NVRM version: NVIDIA UNIX x86_64 Kernel Module  535.183.01  Sun May 12 19:39:15 UTC 2024
GCC version:  gcc version 11.4.0 (Ubuntu 11.4.0-1ubuntu1~22.04) 


那么重装
sudo apt-get install nvidia-driver-535

安装 535版本后, 成功了. nvidia-smi

总结一下: 

/proc/driver/nvidia/version 这个文件看到的就是核心版本

nvidia-smi 看到的就是驱动版本, 那么使用

sudo apt-get install nvidia-driver-535 命令安装跟内核一样的版本即可

还有一种情况, CentOS7.9操作系统, 内核是520版本的, 但是使用命令安装驱动时, 装了最新的 550版本, 在我们不想升级内核的情况下, 那么如何安装 520版本呢?

sudo yum install nvidia-driver-latest-dkms

CentOS7.9 解决办法

1. 卸载最新版本的nvidia driver

sudo yum remove nvidia-driver-latest-dkms

此命令卸载不干净, 增加如下命令

sudo yum remove 'nvidia-*'

清除残留
ls /usr/bin | grep nvidia
ls /lib/modules/$(uname -r)/kernel/drivers/video/ | grep nvidia
sudo rm -rf /usr/bin/nvidia*
sudo rm -rf /lib/modules/$(uname -r)/kernel/drivers/video/nvidia*


sudo yum clean all


2. 安装

通过网址 https://developer.download.nvidia.cn/compute/cuda/repos/rhel7/x86_64/

找到想到的版本rpm链接, 比如我的 520.61.05版本

NVIDIA-SMI 520.61.05    Driver Version: 520.61.05    CUDA Version: 11.8 
NVRM version: NVIDIA UNIX x86_64 Kernel Module  520.61.05  Thu Sep 29 05:30:25 UTC 2022
GCC version:  gcc 版本 4.8.5 20150623 (Red Hat 4.8.5-44) (GCC) 

找到相应的rpm链接进行安装

sudo yum localinstall https://developer.download.nvidia.cn/compute/cuda/repos/rhel7/x86_64/nvidia-driver-latest-dkms-520.61.05-1.el7.x86_64.rpm

如果没有外网, 可以下载后, 通过如下命令安装
sudo yum install ./nvidia-driver-latest-dkms-520.61.05-1.el7.x86_64.rpm


3. 安装成功后 nvidia-smi命令即可使用


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值