1. 安装显卡驱动nvidia
首先查看显卡型号: lspci | grep -i nvi
查看操作系统版本命令:uname -r 查看内核
cat /proc/version
根据这些信息可以在官网 https://www.nvidia.cn/Download/index.aspx?lang=cn 下载驱动文件如下
进入到下载文件的文件夹,修改下载文件为可运行模式 如 chmod 777 NVIDIA-Linux-x86_64-465.31.run
运行下载文件即可完成安装
sudo NVIDIA-Linux-x86_64-465.31.run
2. 验证是否安装成功
nvidia-smi
正常情况下会显示显卡的一些信息如下
nvcc -V
3. 遇到的问题
正常情况下,nvidia-smi会出现显卡的一些信息,但是当运行这个命令时出现 错误如下:
NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver
搜了一些分了集中情况
(1)nvidia-smi出错,但是nvcc -V正常显示 可以参考
https://blog.csdn.net/hangzuxi8764/article/details/86572093
安装dkms
(2)我试了还是不行,试着加载 sudo modprobe nvidia 出现permission的错误
后来在log文件中也发现了这个错误: Lockdown: modprobe: unsigned module loading is restricted; see man kernel_lockdown.7
收到是因为key的原因验证无法通过,需要将security boot的disable掉,参考下面的链接
https://blog.csdn.net/qq_40212975/article/details/106542165
diable security boot后,执行modprobe nvidia 成功
在执行nvidia-smi正常显示,完结!
(有一个查看security boot的命令,忘了记录,以后补上)
注意装驱动和cuda版本之间有个对应关系,官网应该可以找到,在此就不粘贴了