CentOS 8.5+NVIDIA 显卡驱动+CUDA+cuDNN 配置


实验室服务器配置了两块GeForce RTX 3090显卡,安装完系统之后,需要为显卡安装驱动,满足机器学习需要。网上查了一下方法,主要是 这篇文章,但是发现而且NVIDIA显卡驱动更新了新的版本,有些地方以前的方法已经不适用了。在此记录一下。

NVIDIA显卡驱动安装

这一步的安装和这篇文章基本一致,只是我们的显卡选择了最新的NVIDIA-Linux-x86_64-495.46版本。配置到需要的库文件和编译文件,这一步的安装没有出现问题。还可以采用下面讲到的设置NVIDA官方仓库的安装方法,这一方法可以保证NVIDIA与CUDA的版本兼容。

CUDA的安装

这一步则不能参照前面的文章来,由于NVIDIA的驱动更新,如果从CUDA官网下载他们的最新版CUDA Toolkit 11.5,会出现NVIDIA驱动和CUDA的不兼容问题。NVIDIA官网提供的驱动版本太高了,但是官网有找不到可以适配CUDA的低版本,查了一圈之后,发现了新的方法解决这一问题1

  1. 允许epel安装dkms
[root@dlp ~]# dnf --enablerepo=epel -y install kernel-devel-$(uname -r) kernel-headers-$(uname -r) dkms 
  1. 设置NVIDIA官方仓库
[root@cz ~]# dnf config-manager --add-repo http://developer.download.nvidia.com/compute/cuda/repos/rhel8/x86_64/cuda-rhel8.repo
Adding repo from: http://developer.download.nvidia.com/compute/cuda/repos/rhel8/x86_64/cuda-rhel8.repo 
  1. 通过NVIDIA官方仓库安装CUDA11.5
[root@cz ~]# dnf -y install cuda-11-5 
  1. CUDA环境设置
 [root@cz ~]# vi /etc/profile.d/cuda115.sh
# 没有这个文件的话可以新建一个,输入以下内容
export PATH=/usr/local/cuda-11.5/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-11.5/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

[root@dlp ~]# source /etc/profile.d/cuda111.sh 
  1. 验证CUDA是否安装成功
[root@cz ~]# nvcc --version 
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2021 NVIDIA Corporation
Built on Thu_Nov_18_09:45:30_PST_2021
Cuda compilation tools, release 11.5, V11.5.119
Build cuda_11.5.r11.5/compiler.30672275_0

如果显示以上信息,则安装成功。

设置NVIDIA官方仓库的驱动安装方法

如果没有从NVIDIA官方网站下载驱动进行安装的话,我们也可以采用上面的方法步骤1和2设置NVIDIA官方仓库之后,从仓库进行驱动安装。具体方法如下2

  1. 安装最新版本的NVIDIA驱动
[root@cz ~]# dnf module -y install nvidia-driver:latest-dkms 
  1. 卸载系统默认安装的nouveau驱动,加载NVIDIA驱动
[root@cz ~]# modprobe -r nouveau
[root@cz ~]# nvidia-modprobe && nvidia-modprobe -u 
  1. 检验是否安装成功
[root@cz ~]# nvidia-smi 

安装CUDNN

安装CUDNN的方法基本与这篇文章相同,只要NVIDIA与CUDA的版本对上了,剩下的基本就没有问题了。这里我们在官网下载的是CUDA11.5对应的CUDNN版本 cudnn-linux-x86_64-8.3.1.22_cuda11.5-archive.tar.xz。具体安装步骤如下3

[root@cz ~]# tar -xvJf cudnn-linux-x86_64-8.3.1.22_cuda11.5-archive.tar.xz
[root@cz ~]# cd cudnn-linux-x86_64-8.3.1.22_cuda11.5-archive
[root@cz ~]# cp include/cudnn*.h /usr/local/cuda-11.5/include
[root@cz ~]# cp lib/libcudnn* /usr/local/cuda-11.5/lib64 
[root@cz ~]# chmod a+r /usr/local/cuda-11.5/include/cudnn*.h /usr/local/cuda-11.5/lib64/libcudnn*

  1. 具体可参考这个网页 ↩︎

  2. 具体可参考这个网页 ↩︎

  3. 具体可参考官网方法 ↩︎

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
要在CentOS 7上部署stable-diffusion-webui与NVIDIA GPU,首先需要确保您的系统满足以下要求: 1. 确保您的计算机上已经安装了合适版本的CentOS 7操作系统,可以通过官方渠道下载并安装。 2. 确保您的计算机上具备NVIDIA GPU,并安装了NVIDIA的驱动程序。您可以从NVIDIA的官方网站下载并安装适合您GPU型号和CentOS版本的驱动程序。 接下来,您可以按照以下步骤进行stable-diffusion-webui部署: 1. 安装Docker:在CentOS 7上安装Docker以便运行容器化应用程序。您可以使用以下命令安装Docker: ``` sudo yum install docker ``` 2. 启动Docker服务并将其设置为开机自启动: ``` sudo systemctl start docker sudo systemctl enable docker ``` 3. 下载并运行stable-diffusion-webui容器: ``` sudo docker run -e GPU_INDEX=0 -p 80:80 diffusionai/stable-diffusion-webui ``` - 通过"GPU_INDEX=0"参数指定使用的GPU索引,如果您有多个GPU,可以根据需要进行调整。 - 使用"-p 80:80"参数将容器的80端口映射到主机的80端口,使得Web界面可以通过主机的IP地址进行访问。 4. 这样,您就成功地将stable-diffusion-webui部署在CentOS 7上了。现在,您可以在任意浏览器中访问http://您的主机IP地址,即可使用stable-diffusion-webui进行图像处理和分析。 请注意,上述步骤假设您已经正确地安装了操作系统和GPU驱动程序,并且系统中只有一个NVIDIA GPU可用。如果您遇到任何问题,建议参考各种文档和安装指南,或者咨询相关领域的专业人士。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值