SM_30,如,Quadro K4000。
Centos8.4,内核4.18.0-348.7.1.el8_5.x86_64。
(1)安装nvidia驱动
1、启动方式需要为BIOS,不是UEFI。
2、禁用nouveau并重启(安装Nvidia显卡的官方驱动和系统自带的nouveau驱动冲突)
lsmod |grep nouveau
如果有输出说明nouveau正在加载
打开禁用列表/etc/modprobe.d/blacklist-nouveau.conf
在最后一行加上
blacklist nouveau
options nouveau modset=0
然后更新重塑
>>>dracut /boot/initramfs-`(uname -r).img `(uname -r)
重启机器
reboot
查看是否禁用成功,输入
lsmod |grep nouveau
若没有输出,则表示禁用成功
3、安装基础依赖环境
yum -y install gcc kernel-devel kernel-headers
4、、安装驱动
在Nvidia官网下载相应驱动
官网下载地址:https://www.nvidia.cn/Download/index.aspx?lang=cn
NVIDIA-Linux-x86_64-470.182.03.run
下载成功后上传至Linux服务起,如/opt目录下,进入下载的驱动所在目录执行安装
chmod +x NVIDIA-Linux-x86_64-470.182.03.run
sh NVIDIA-Linux-x86_64-470.182.03.run -no-opengl-files -no-nouveau-check
安装过程中选择accept
如果提示要修改xorg.conf,选择yes
如果报此错: WARNING: You do not appear to have an NVIDIA GPU supported by the 430.34 NVIDIA Linux graph
加上:–add-this-kernel 参数
如果报此错: unable to find the kernel source tree for the currently running kernel…
加上:–kernel-source-path=/usr/src/kernels/内核号(2+Tab键 自动出现)
如果报此错:unable to load the kernel module ‘nvidia.ko’ …
执行:./NVIDIA-XXXX.run --kernel-source-path=/usr/src/kernels/内核号 -k ·(uname -r)
回车!
检查是否安装成功
nvidia-smi
Thu Apr 20 04:08:24 2023
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 470.182.03 Driver Version: 470.182.03 CUDA Version: 11.4 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|===============================+======================+======================|
| 0 Quadro K4000 Off | 00000000:13:00.0 Off | N/A |
| 30% 41C P8 10W / 87W | 0MiB / 3018MiB | 0% Default |
| | | N/A |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=============================================================================|
| No running processes found |
+-----------------------------------------------------------------------------+
(2)安装CUDA
下载CUDA文件
下载地址-https://developer.nvidia.cn/cuda-toolkit-archive
比如我下载的版本是cuda_10.2.89_440.33.01_linux.run (最后一个支持SM_30的版本)
首先给cuda可执行权限:
chmod +x cuda_10.2.89_440.33.01_linux.run
运行cuda文件:
sh cuda_10.2.89_440.33.01_linux.run
安装过程的选项选择:
会先有个阅读声明,一直按D即可,然后accept。
选项install nvidia accelerated Graphics Driver,输入n,因为我们已经安装了nvidia的驱动。
选项install the OpenGL libraries,如果双显卡(集显+独显)选择n,如果只有独显可以选择y,如果双显卡选择y的话,会出现黑屏或者循环登录的问题,如果加了上面的参数就不会出现这个选项了。
后面的可以都选择yes,最后一个选项我们可以选择n,也就是不复制Samples,因为安装目录下有samples。
安装过程结束后会有以下信息:
Driver: Not Selected
Toolkit: Installed in /usr/local/cuda-10.2/
Samples: Installed in /root/
代表安装完成,但是不代表成功。这时需要重启。
验证cuda是否安装成功
将cuda的bin文件和lib导出到系统环境中:
export PATH="/usr/local/cuda-10.2/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda-10.2/lib64:$LD_LIBRARY_PATH"
终端输入:
nvcc -V
如果有CU