Centos 7.8 中安装Nvidia A100 GPU驱动

本文介绍如何在Centos 7.8 操作系统中禁用nouveau驱动,并安装Nvidia Tesla A100型号GPU的驱动,并安装CUDA11.6和cuDNN。

系统中查看GPU信息

系统安装完成之后,进入系统,使用lspci 命令查询一下GPU是否存在、型号信息是什么。

[root@node01 ~]# lspci | grep -i nvidia

下载NVIDIA Tesla A100驱动

通过lspci查询到GPU的型号之后,访问官网nvidia.com下载驱动程序可以按照如下选择,选择产品类型、系列、型号、然后根据自己的操作系统来选择。
注意:如果操作系统是Linux,尽量选择Linux 32-bit/Linux 64-bit,不需要选择详细的Linux发行版本。测试是发现选择详细的Linux发行版本,安装驱动之后,找不到nvidia-smi命令
 

安装gcc等依赖包

当安装GPU驱动时,提示缺少相关的依赖包,在此,我们需要提前安装相关的依赖包,目前需要用到的是gcc , g++ , make :

[root@localhost ~]# yum -y install gcc gcc-c++ kernel-devel make

屏蔽nouveau开源版本的GPU驱动

当系统安装完成之后,会安装系统开源的NVIDIA驱动版本,名称为nouveau。查看nouveau驱动是否加载。

[root@localhost ~]# lsmod |grep -i nouveau


下面将屏蔽该驱动。编辑/etc/default/grub文件,修改GRUB_CMDLINE_LINUX一行:

[root@localhost ~]# cat /etc/default/grub


保存退出,更新grub:

[root@localhost ~]# grub2-mkconfig -o /boot/grub2/grub.cfg
Generating grub configuration file ...
Found linux image: /boot/vmlinuz-3.10.0-1160.el7.x86_64
Found initrd image: /boot/initramfs-3.10.0-1160.el7.x86_64.img
Found linux image: /boot/vmlinuz-0-rescue-91fd57f1c90a4a2da20ef93ed7f886c6
Found initrd image: /boot/initramfs-0-rescue-91fd57f1c90a4a2da20ef93ed7f886c6.img
done
[root@localhost ~]# grub2-mkconfig -o /boot/grub2/grub.efi.cfg
Generating grub configuration file ...
Found linux image: /boot/vmlinuz-3.10.0-1160.el7.x86_64
Found initrd image: /boot/initramfs-3.10.0-1160.el7.x86_64.img
Found linux image: /boot/vmlinuz-0-rescue-91fd57f1c90a4a2da20ef93ed7f886c6
Found initrd image: /boot/initramfs-0-rescue-91fd57f1c90a4a2da20ef93ed7f886c6.img


编辑/lib/modprobe.d/dist-blacklist.conf,把 blacklist nvidiafb 改成 #blacklist nvidiafb,然后在最下面添加blacklist nouveau和。

[root@localhost ~]# vim /lib/modprobe.d/dist-blacklist.conf
# blacklist nvidiafb
blacklist nouveau
options nouveau modeset=0



备份initrams并使用dracut重新建立initramfs并重启系统:

[root@localhost ~]# mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
[root@localhost ~]# dracut -v /boot/initramfs-$(uname -r).img $(uname -r)
[root@localhost ~]#  reboot

查看nouveau模块是否加载,不显示的话就表示已经禁用:

# lsmod | grep nouveau

安装NVIDIA GPU驱动

安装下载的GPU驱动:NVIDIA-Linux-x86_64-510.47.03.run ,目前驱动版本为:510.47.03,如下执行该驱动文件,即可安装。

[root@localhost ~]# ./NVIDIA-Linux-x86_64-346.47.run



输入nvidia-smi来查看是否可以看到GPU信息:

[root@localhost ~]# nvidia-smi


至此安装完成。

安装CUDA 11.6

访问nvidia官网,下载CUDA,cuda的链接为:https://developer.nvidia.com/cuda-downloads
选择runfile文件来安装。

[root@localhost ~]# wget https://developer.download.nvidia.com/compute/cuda/11.6.0/local_installers/cuda_11.6.0_510.39.01_linux.run
[root@localhost ~]# sudo sh cuda_11.6.0_510.39.01_linux.run

如下图,Driver选项不要勾选了,前面已经安装GPU驱动了。


创建环境变量,编辑~/.bashrc文件:

[root@localhost ~]# vim ~/.bashrc

将下面命令追加到文件最后面:

export CUDA_HOME=/usr/local/cuda
export PATH=$PATH:$CUDA_HOME/bin
export LD_LIBRARY_PATH=/usr/local/cuda-11.6/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
 

nvcc命令创建一个软连接到/usr/bin目录:

[root@localhost ~]# sudo ln -s /usr/local/cuda/bin/nvcc /usr/bin/nvcc

使用nvcc命令查看cuda的版本:

[root@localhost ~]# nvcc --version
  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值