安装driver
1. 检查GPU硬件
lspci | grep -i nvidia
2. 安装GCC、kernal组件、dkms等
sudo yum install gcc
sudo yum install gcc-c++
sudo yum -y install kernel-devel
sudo yum -y install kernel-headers
sudo yum -y install epel-release
sudo yum -y install dkms
可能要检查kernel和kenel-devel、kernel-headers版本一致
3. 下载显卡驱动
4. 禁用nouveau显卡驱动
打开配置文件:
vim /usr/lib/modprobe.d/dist-blacklist.conf
加上两行
blacklist nouveau
options nouveau modeset=0
注释掉
blacklist nvidiafb
重建 initramfs image
mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
dracut /boot/initramfs-$(uname -r).img $(uname -r)
重启
systemctl set-default multi-user.target #修改运行级别为文本模式,没有尝试
reboot
查看nouveau是否禁用, 如果没有输出代表成功
lsmod | grep nouveau
5. 赋予运行权限
chmod a+x NVIDIA-Linux-x86_64-440.118.02.run
6. 安装驱动
sudo ./NVIDIA-Linux-x86_64-440.118.02.run
或
./NVIDIA-Linux-x86_64-450.51.06.run --kernel-source-path=/usr/src/kernels/3.10.0-1127.19.1.el7.x86_64/
建议选项
dkms: yes
32 位兼容: yes
nvidia-xconfig: no
安装cuda
1. 下载cuda
2. 安装
官方方法
wget https://developer.download.nvidia.com/compute/cuda/12.4.1/local_installers/cuda_12.4.1_550.54.15_linux.run
sudo sh cuda_12.4.1_550.54.15_linux.run
输入accept接受协议,回车取消driver安装选项
安装完成出现:
3. CUDA导出为环境变量
vim打开
vi ~/.bashrc
在then 和 fi 块中添加
export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
在当前shell中执行,使环境变量生效
source ~/.bashrc
检查
nvcc -V
nvidia-smi