目录
nvidia-docker2安装
docker想使用GPU就需要安装依赖nvidia-docker2
1、安装前升级下docker-ce到最新,只在需要安装nVidia-docker2的机器上
yum update docker-ce
systemctl daemon-reload
systemctl restart docker
2、在线安装
curl -s -L https://nvidia.github.io/nvidia-docker/centos7/nvidia-docker.repo | sudo tee /etc/yum.repos.d/nvidia-docker.repo
yum install -y nvidia-docker2
驱动安装
CentOS 7 查询显卡型号
命令: lspci -nn | grep NV
lspci | grep -i nvidia
输出: 3b:00.0 3D controller [0302]: NVIDIA Corporation TU104GL [Tesla T4] [10de:1eb8] (rev a1)
如未显示[Tesla T4]字样登录以下地址根据1eb8查看,如下:
http://pci-ids.ucw.cz/mods/PC/10de?action=help?help=pci
根据GPU型号下载对应的驱动程序
下载地址: 官方驱动 | NVIDIA
安装编译环境(需要连接外网)
安装gcc、kernel-devel、kernel-headers
yum -y install gcc gcc-c++ kernel-devel "kernel-devel-uname-r == $(uname -r)"
阻止nouveau模块的加载
修改/usr/lib/modprobe.d/dist-blacklist.conf文件
方法:在文件中添加dist-blacklist.conf
注释掉 blacklist nvidiafb
加上 blacklist nouveau
options nouveau modeset=0
sed -i 's/blacklist nvidiafb/#blacklist nvidiafb/g' /usr/lib/modprobe.d/dist-blacklist.conf
echo -e "blacklist nouveau\noptions nouveau modeset=0" >> /usr/lib/modprobe.d/dist-blacklist.conf
重新建立initramfs image文件
mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
dracut /boot/initramfs-$(uname -r).img $(uname -r)
检查nouveau模块状态
重启节点:reboot now
在root用户下执行,查看并确保nouveau没有被加载
执行lsmod | grep nouveau无输出即可
安装驱动
执行 init 3 进入命令行模式(必须执行,否则安装驱动时会出错)
上传驱动 NVIDIA-Linux-x86_64-418.126.02.run
进入驱动所在目录执行命令,其中的xxxxx请根据驱动文件和/usr/src/kernels/下的文件来写
sh NVIDIA-Linux-x86_64-418.126.02.run --kernel-source-path=/usr/src/kernels/3.x.x.x.el7.x86_64 -k $(uname -r)
可能出现build错误,提示使用--no-drm参数再安装一遍
其他注意事项:可使用一下参数
--dkms 可以将Nvidia模块编译进内核默认加载模块,以后升级内核时不需要重新重新安装驱动
-s 选项是silence模式安装,去掉-s是交互式模式安装
查看内核
nvidia-smi
安装完成后,执行init 5,返回页面模式
Yum安装参考
centos7 nvidia驱动安装失败问题的解决办法_DreamNotOver的博客-CSDN博客
卸载
nvidia-uninstall