centos7安装显卡驱动、cuda以及cudnn

安装准备

  1. 前提机器上面有支持CUDA的Nvidia GPU,查看支持CUDA的GPU列表: https://developer.nvidia.com/cuda-gpus
 lspci | grep -i nvidia

服务器使用的是 2204, 2204指的是3090显卡

00:06.0 VGA compatible controller: NVIDIA Corporation Device 2204 (rev a1)
00:07.0 VGA compatible controller: NVIDIA Corporation Device 2204 (rev a1)
00:08.0 VGA compatible controller: NVIDIA Corporation Device 2204 (rev a1)
00:09.0 VGA compatible controller: NVIDIA Corporation Device 2204 (rev a1)
  1. 验证系统是否是受支持的Linux版本
uname -m && cat /etc/redhat-release

到这里查看受支持的Linux版本:http://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html#system-requirements

  1. 验证系统是否有GCC编译环境
gcc -v

输出为

使用内建 specs。
COLLECT_GCC=gcc
COLLECT_LTO_WRAPPER=/usr/libexec/gcc/x86_64-redhat-linux/4.8.5/lto-wrapper
目标:x86_64-redhat-linux
配置为:../configure --prefix=/usr --mandir=/usr/share/man --infodir=/usr/share/info --with-bugurl=http://bugzilla.redhat.com/bugzilla --enable-bootstrap --enable-shared --enable-threads=posix --enable-checking=release --with-system-zlib --enable-__cxa_atexit --disable-libunwind-exceptions --enable-gnu-unique-object --enable-linker-build-id --with-linker-hash-style=gnu --enable-languages=c,c++,objc,obj-c++,java,fortran,ada,go,lto --enable-plugin --enable-initfini-array --disable-libgcj --with-isl=/builddir/build/BUILD/gcc-4.8.5-20150702/obj-x86_64-redhat-linux/isl-install --with-cloog=/builddir/build/BUILD/gcc-4.8.5-20150702/obj-x86_64-redhat-linux/cloog-install --enable-gnu-indirect-function --with-tune=generic --with-arch_32=x86-64 --build=x86_64-redhat-linux
线程模型:posix
gcc 版本 4.8.5 20150623 (Red Hat 4.8.5-44) (GCC)

没有的话需要先安装GCC,Centos7的最小化安装一般勾选上开发软件都会自动安装GCC

  1. 验证系统是否安装了正确的内核头文件和开发包
sudo yum install kernel-devel-$(uname -r) kernel-headers-$(uname -r)

开始安装

  1. 禁用nouveau

nouveau是一个第三方开源的Nvidia驱动,一般Linux安装的时候默认会安装这个驱动。 这个驱动会与Nvidia官方的驱动冲突,在安装Nvidia驱动和和CUDA之前应先禁用nouveau

  • 查看系统是否正在使用nouveau
lsmod | grep nouveau
  • 如果有显示内容,则进行以下的步骤: (Centos7禁用方法, 需要重启服务器)
#新建一个配置文件
sudo vim /etc/modprobe.d/blacklist-nouveau.conf
#写入以下内容
blacklist nouveau
options nouveau modeset=0
#保存并退出
:wq
#备份当前的镜像
sudo mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
#建立新的镜像
sudo dracut /boot/initramfs-$(uname -r).img $(uname -r)
#重启
sudo reboot
#最后输入上面的命令验证
lsmod | grep nouveau
  1. 安装驱动

GPU 云服务器正常工作需安装正确的基础设施软件,对 NVIDIA 系列 GPU 而言,有两个层次的软件包需要安装:

  • 驱动 GPU 工作的硬件驱动程序。
  • 上层应用程序所需要的库。

若把 NVIDIA GPU 用作通用计算,需要安装 3090 Driver + CUDA。

2.2 rpm 包安装

  • 打开 NVIDIA 驱动下载链接 http://www.nvidia.com/Download/Find.aspx(尽量选一个最新的吧)。
    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Yr4sj2U2-1662444134868)(evernotecid://DE6E6267-EF45-4EAD-85F7-BA95E1D4DD97/appyinxiangcom/1971784/ENResource/p218)]

  • 默认的就是runfile文件NVIDIA-Linux-x86_64-515.65.01.run

  • 下载后直接sh NVIDIA-Linux-x86_64-515.65.01.run

  • 运行nvidia-smi能输出正确信息代表驱动安装成功。

Tue Sep  6 10:05:08 2022
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 515.65.01    Driver Version: 515.65.01    CUDA Version: 11.7     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  NVIDIA GeForce ...  Off  | 00000000:00:06.0 Off |                  N/A |
| 30%   38C    P0   113W / 350W |      0MiB / 24576MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
|   1  NVIDIA GeForce ...  Off  | 00000000:00:07.0 Off |                  N/A |
| 30%   40C    P0   116W / 350W |      0MiB / 24576MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
|   2  NVIDIA GeForce ...  Off  | 00000000:00:08.0 Off |                  N/A |
| 30%   43C    P0   118W / 350W |      0MiB / 24576MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
|   3  NVIDIA GeForce ...  Off  | 00000000:00:09.0 Off |                  N/A |
| 30%   43C    P0   114W / 350W |      0MiB / 24576MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
|  No running processes found                                                 |
+-----------------------------------------------------------------------------+
  1. 安装 CUDA
    CUDA (Compute Unified Device Architecture) 是显卡厂商 NVIDIA 推出的运算平台。 CUDA™ 是一种由 NVIDIA 推出的通用并行计算架构,该架构使 GPU 能够解决复杂的计算问题。 它包含了 CUDA 指令集架构(ISA)以及 GPU 内部的并行计算引擎。 开发人员现在可以使用 C 语言, C++ , FORTRAN 来为 CUDA™ 架构编写程序,所编写出的程序可以在支持 CUDA™ 的处理器上以超高性能运行。GPU 云服务器采用 NVIDIA 显卡,需要安装 CUDA 开发运行环境。
  • CUDA驱动下载:https://developer.nvidia.com/cuda-downloads?target_os=Linux

  • 选择对应的操作系统和安装包。这里注意,我下载的是最新的11.7的,依据是nvidia-smi的输出CUDA Version: 11.7,你要按照自己的输出安装对应的cuda,要不然有问题。

  • 下载的时候选择runfile(local),然后下面会有安装指南

  • 测试是否安装成功

nvcc -V
  • 成功的结果
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2022 NVIDIA Corporation
Built on Wed_Jun__8_16:49:14_PDT_2022
Cuda compilation tools, release 11.7, V11.7.99
Build cuda_11.7.r11.7/compiler.31442593_0

4 安装 CUDNN

conda方案

  1. conda 安装略过

  2. 3090机器的conda安装

conda install cudatoolkit=11.7 cudnn=8 
  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
您好!要在CentOS 7上安装CUDA 10.2和cuDNN 8,您可以按照以下步骤进行操作: 1. 检查您的显卡是否支持CUDA 10.2,并确保您已经安装了适当的驱动程序。 2. 前往NVIDIA官网下载CUDA Toolkit 10.2的安装包(https://developer.nvidia.com/cuda-10.2-download-archive)。选择合适的版本(rpm或runfile)并下载到您的系统上。 3. 安装CUDA Toolkit 10.2。如果您下载的是rpm文件,请使用以下命令安装: ``` $ sudo rpm -i cuda-repo-<version>.rpm $ sudo yum clean all $ sudo yum install cuda ``` 如果您下载的是runfile文件,请使用以下命令安装: ``` $ sudo sh cuda_<version>_linux.run ``` 根据提示进行安装并接受许可协议。 4. 等待CUDA Toolkit的安装完成后,添加CUDA的环境变量。打开终端并编辑`~/.bashrc`文件,添加以下行: ``` export PATH=/usr/local/cuda-10.2/bin:$PATH export LD_LIBRARY_PATH=/usr/local/cuda-10.2/lib64:$LD_LIBRARY_PATH ``` 保存文件后,运行`source ~/.bashrc`使其生效。 5. 下载cuDNN 8,您需要先注册NVIDIA开发者计划(如果尚未注册),然后前往https://developer.nvidia.com/rdp/cudnn-archive下载cuDNN 8对应的版本。 6. 将下载的cuDNN 8压缩文件解压缩,并将文件复制到CUDA安装目录中。打开终端,运行以下命令: ``` $ tar -xzvf <path_to_cudnn_tar> $ sudo cp cuda/include/cudnn*.h /usr/local/cuda-10.2/include $ sudo cp cuda/lib64/libcudnn* /usr/local/cuda-10.2/lib64 $ sudo chmod a+r /usr/local/cuda-10.2/include/cudnn*.h /usr/local/cuda-10.2/lib64/libcudnn*

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值