本机环境: lsb_release -a
Distributor ID: Ubuntu
Description: Ubuntu 22.04.2 LTS
Release: 22.04
Codename: jammy
产生的原因是: 我使用 nvcc -V 时, 发现此命令不存在, 则安装之
使用命令安装
sudo apt install nvidia-cuda-toolkit
安装后, 导致 nvidia-smi命令报错 Failed to initialize NVML: Driver/library version mismatch
在网上看到很多都在讲 NVIDIA内核驱动版本和系统驱动不一致,
那么我们关心的第一个问题就是
NVIDIA内核驱动版本 是什么?
系统驱动是什么?
cat /proc/driver/nvidia/version文件,该文件应该包含驱动的版本信息
输出
NVRM version: NVIDIA UNIX x86_64 Kernel Module 530.30.02 Wed Feb 22 04:11:39 UTC 2023
GCC version: gcc version 11.3.0 (Ubuntu 11.3.0-1ubuntu1~22.04)
安装 nvidia-driver-530 试试
sudo apt-get install nvidia-driver-530
安装后, 设备找不到了
No devices were found
安装 nvidia-driver-550 试试
sudo apt-get install nvidia-driver-550
nvidia-smi 开始报错
Failed to initialize NVML: Driver/library version mismatch
NVML library version: 550.107
cat /proc/driver/nvidia/version 报 535版本
NVRM version: NVIDIA UNIX x86_64 Kernel Module 535.183.01 Sun May 12 19:39:15 UTC 2024
GCC version: gcc version 11.4.0 (Ubuntu 11.4.0-1ubuntu1~22.04)
那么重装
sudo apt-get install nvidia-driver-535
安装 535版本后, 成功了. nvidia-smi
总结一下:
/proc/driver/nvidia/version 这个文件看到的就是核心版本
nvidia-smi 看到的就是驱动版本, 那么使用
sudo apt-get install nvidia-driver-535 命令安装跟内核一样的版本即可
还有一种情况, CentOS7.9操作系统, 内核是520版本的, 但是使用命令安装驱动时, 装了最新的 550版本, 在我们不想升级内核的情况下, 那么如何安装 520版本呢?
sudo yum install nvidia-driver-latest-dkms
CentOS7.9 解决办法
1. 卸载最新版本的nvidia driver
sudo yum remove nvidia-driver-latest-dkms
此命令卸载不干净, 增加如下命令
sudo yum remove 'nvidia-*'
清除残留
ls /usr/bin | grep nvidia
ls /lib/modules/$(uname -r)/kernel/drivers/video/ | grep nvidia
sudo rm -rf /usr/bin/nvidia*
sudo rm -rf /lib/modules/$(uname -r)/kernel/drivers/video/nvidia*
sudo yum clean all
2. 安装
通过网址 https://developer.download.nvidia.cn/compute/cuda/repos/rhel7/x86_64/
找到想到的版本rpm链接, 比如我的 520.61.05版本
NVIDIA-SMI 520.61.05 Driver Version: 520.61.05 CUDA Version: 11.8
NVRM version: NVIDIA UNIX x86_64 Kernel Module 520.61.05 Thu Sep 29 05:30:25 UTC 2022
GCC version: gcc 版本 4.8.5 20150623 (Red Hat 4.8.5-44) (GCC)
找到相应的rpm链接进行安装
sudo yum localinstall https://developer.download.nvidia.cn/compute/cuda/repos/rhel7/x86_64/nvidia-driver-latest-dkms-520.61.05-1.el7.x86_64.rpm
如果没有外网, 可以下载后, 通过如下命令安装
sudo yum install ./nvidia-driver-latest-dkms-520.61.05-1.el7.x86_64.rpm
3. 安装成功后 nvidia-smi命令即可使用