1. 物理机安装驱动
https://blog.csdn.net/wm6752062/article/details/126480051
1.1 下载驱动
从官方驱动 | NVIDIA下载驱动程序,此处下载了NVIDIA-Linux-x86_64-515.57.run。
1.2 禁用nouveau
检查系统是否存在nouveau驱动:
lsmod | grep nouveau
如果没有输出则表示禁用成功,进入下一步。
如果有输出则表示存在nouveau驱动,禁用nouveau驱动,编辑/lib/modprobe.d/dist-blacklist.conf,在最后加上以下内容
blacklist nouveau
options nouveau modeset=0
备份initramfs:
mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
重新建立initramfs:
dracut -v /boot/initramfs-$(uname -r).img $(uname -r)
重启服务器
启动后重新检查是否存在
1.3 安装显卡驱动
./NVIDIA-Linux-x86_64-515.57.run -no-x-check
1.4 查看显卡
nvidia-smi
2. 安装docker(19.03以上版本)
3. 安装docker驱动
#可以先不下载yum源直接安装试试,如果不行再更新yum源
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-container-runtime/$distribution/nvidia-container-runtime.repo | \
sudo tee /etc/yum.repos.d/nvidia-container-runtime.repo
yum install nvidia-container-runtime
4. 修改docker配置文件
cat daemon.json
{ "insecure-registries": ["http://repository.bde.local"], "exec-opts": ["native.cgroupdriver=systemd"], "bip":"173.236.0.1/16" ,
"default-runtime": "nvidia",
"runtimes": {
"nvidia": {
"path": "nvidia-container-runtime",
"runtimeArgs": []
}
}
}
5. 重启docker
systemctl daemon-reload
systemctl restart docker
systemctl enable docker