Centos 7.3配置nvidia-docker(深度学习)

基本环境:centos7.3

1.配置国内镜像:

1.1 修改nameserver

vi /etc/resolv.conf 

将原始的nameserver改为114.114.114.114,并且添加一个nameserver:8.8.8.8

114.114.114.114是国内首家云安全DNS 地址,8.8.8.8是Google提供的免费DNS服务器的IP地址

1.2 修改国内源(这里采用清华镜像源)

具体方式可以在清华镜像源中找到,最后yum makecache

 

2.安装nvidia驱动(命令行安装)

参考网站1:https://blog.csdn.net/w18750930043/article/details/80622783

参考网站2:https://serverfault.com/questions/870211/yum-install-kmod-nvidia-kernel-issue

按照ELRepo添加之后,安装kmod-nvidia很有可能会有内核错误问题,即:

软件包:kmod-nvidia-410.73-2.el7_6.elrepo.x86_64 (elrepo)
          需要:kernel(drm_atomic_helper_plane_reset) = 0x97498548
          已安装: kernel-3.10.0-514.el7.x86_64 (@anaconda)
              kernel(drm_atomic_helper_plane_reset) = 0xabd4c98d
          已安装: kernel-3.10.0-862.el7.x86_64 (@base)
              kernel(drm_atomic_helper_plane_reset) = 0xe7694b10
          已安装: kernel-3.10.0-862.14.4.el7.x86_64 (@updates)
              kernel(drm_atomic_helper_plane_reset) = 0xe7694b10
          已安装: kernel-ml-4.19.4-1.el7.elrepo.x86_64 (@elrepo-kernel)
              kernel(drm_atomic_helper_plane_reset) = 0x3663ba58
          可用: kernel-3.10.0-862.2.3.el7.x86_64 (updates)
              kernel(drm_atomic_helper_plane_reset) = 0xe7694b10
…………………………………………………………
          可用: kernel-debug-3.10.0-862.el7.x86_64 (base)
              kernel(drm_atomic_helper_plane_reset) = 0x1ccd0c71
          可用: kernel-debug-3.10.0-862.2.3.el7.x86_64 (updates)
              kernel(drm_atomic_helper_plane_reset) = 0x1ccd0c71
          可用: kernel-debug-3.10.0-862.3.2.el7.x86_64 (updates)
              kernel(drm_atomic_helper_plane_reset) = 0x1ccd0c71
          可用: kernel-debug-3.10.0-862.3.3.el7.x86_64 (updates)
……………………………………………………

解决方法:

2.1 查看可用驱动(针对不同内核版本)

sudo yum --enablerepo=elrepo --showduplicates list kmod-nvidia

2.2 选取安装可用驱动

不一定选取最新的版本,这应该取决于centos7当前所用内核(查看命令:uname -r),最笨的方法是逐个尝试,如我选取的如下:

sudo yum install kmod-nvidia-390.87-1.el7_5.elrepo -y

不报警告/错误,显示如下即成功(这里是中文版):

已安装:
  kmod-nvidia.x86_64 0:390.87-1.el7_5.elrepo 

2.3 测试

重启centos7并测试,测试命令:

nvidia-smi

补充:可能需要升级内核,可以参考https://blog.csdn.net/kikajack/article/details/79396793

 

3. docker安装(centos7)

3.1 docker

直接参考网站:https://mirrors.tuna.tsinghua.edu.cn/help/docker-ce/

3.2 nvidia-docker

参考网站1:https://github.com/NVIDIA/nvidia-docker

参考网站2:https://blog.csdn.net/lantuxin/article/details/83795159

参考网站3:https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html#pre-installation-actions

3.2.1 安装centos7的kernel headers以及development packages

sudo yum install kernel-devel-$(uname -r) kernel-headers-$(uname -r)

原因---参考网站3中的2.4有这么一句话:The CUDA Driver requires that the kernel headers and development packages for the running version of the kernel be installed at the time of the driver installation, as well whenever the driver is rebuilt. For example, if your system is running kernel version 3.17.4-301, the 3.17.4-301 kernel headers and development packages must also be installed.

3.2.2 移除之前安装过的nvidia-docker1

sudo docker volume ls -q -f driver=nvidia-docker | xargs -r -I{} -n1 docker ps -q -a -f volume={} | xargs -r docker rm -f
sudo yum remove nvidia-docker

3.2.3 添加包仓库

distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.repo | sudo tee /etc/yum.repos.d/nvidia-docker.repo

3.2.4 安装nvidia-docker2

sudo yum install -y nvidia-docker2
sudo pkill -SIGHUP dockerd

3.2.5 测试带cuda的镜像

docker run --runtime=nvidia --rm nvidia/cuda:9.0-base nvidia-smi

当然,也可以测试docker中的cuda:

sudo nvidia-docker run -it --rm registry.docker-cn.com/nvidia/cuda:latest bash
nvcc -V

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
要在CentOS 7上安装nvidia-docker,可以按照以下步骤进行操作: 1. 首先,设置nvidia-docker的存储库和GPG密钥。可以使用以下命令将存储库添加到系统中: ``` distribution=$(. /etc/os-release;echo $ID$VERSION_ID) && curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.repo | sudo tee /etc/yum.repos.d/nvidia-docker.repo ``` 2. 接下来,更新包列表并安装nvidia-docker及其依赖项。可以使用以下命令完成此操作: ``` sudo yum clean expire-cache sudo yum install -y nvidia-docker2 ``` 3. 安装完成后,重新启动docker服务以使更改生效: ``` sudo systemctl restart docker ``` 4. 最后,您可以使用以下命令来测试nvidia-docker是否安装成功: ``` sudo nvidia-docker run --rm --gpus all nvidia/cuda:11.2-base nvidia-smi ``` 请注意,这些步骤是基于CentOS 7的安装过程。如果您需要其他操作系统的安装指南,可以参考Docker官方文档\[3\]中提供的链接。 参考资料: \[2\] Linux安装docker \[3\] Docker官方文档 #### 引用[.reference_title] - *1* *2* [CentOS7服务器部署nvidia-docker](https://blog.csdn.net/qq_29183811/article/details/123558987)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [Ubuntu16(Centos7) dockernvidia-docker 的安装及使用](https://blog.csdn.net/mzpmzk/article/details/89097489)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值