【Docker】Docker及Nvidia Container Toolkit安装


本文将讲一下如何安装docker以及Nvidia contaioner toolkit,从而构建容器使用GPU的基础。docker容器技术越来越普及,也成为算法部署的一种主流,可以实现一次构建多次部署。

1、Docker Engine安装

打开docker官网https://docs.docker.com/engine/install/ubuntu/#install-using-the-repository,选择合适的平台,我们是ubuntu。按照官方指导进行安装

1.1 填加docker ce安装源到系统


sudo apt-get update
#安装依赖
sudo apt-get install apt-transport-https ca-certificates curl gnupg-agent software-properties-common
#填加官方gpg,执行完会输出OK
curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add -
#填加仓库
sudo add-apt-repository "deb [arch=amd64] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable"

1.2 docker ce 安装

sudo apt-get update
#后两个不写也可以会自动安装
sudo apt-get install docker-ce docker-ce-cli containerd.io

如果要验证安装:

sudo docker run hello-world
#或者
sudo docker version

hello-world会看到:
在这里插入图片描述

到此,docker安装成功。docker 的升级,版本选择,删除等查看本文提供的链接。
安装完成后,进行如下配置,避免每次都输入sudo。本文此后内容要依本操作是否执行来自行选择是否要加sudo。

sudo groupadd docker
sudo usermod -aG docker $USER #最后是获取用户名
#重启docker服务
sudo service docker restart
newgrp - docker

1.3 国内安装环境设置

1.3.1 docker 国内源设置

因为网络原因,步骤1.1和1.2有时并不能成功执行,这时,需要使用国内镜像来安装,如中科大、清华、阿里云的源。
安装 Docker CE,请按照 官方安装文档 ,选择你对应的系统,按命令进行执行,步骤1.1和1.2是以 Ubuntu 为例,参考 官方 Ubuntu 安装 Docker CE 手册 进行安装的,如果使用国内源如清华的要参考https://mirror.tuna.tsinghua.edu.cn/help/docker-ce/,使用中科大的源参考http://mirrors.ustc.edu.cn/help/docker-ce.html,国内源只是把 download.docker.com地址换成 mirrors.ustc.edu.cn/docker-cemirrors.tuna.tsinghua.edu.cn/docker-ce 即可。如下为改后内容:

sudo apt-get update
#安装依赖
sudo apt-get install apt-transport-https ca-certificates curl gnupg-agent software-properties-common
#填加官方gpg,执行完会输出OK
curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add -
#填加仓库
sudo add-apt-repository "deb [arch=amd64] https://mirrors.ustc.edu.cn/docker-ce/linux/ubuntu $(lsb_release -cs) stable"
sudo apt-get update
#后两个不写也可以会自动安装
sudo apt-get install docker-ce docker-ce-cli containerd.io

1.3.2 docker hub国内源设置

同样使用docker hub要用国内源才可以使用,对于使用 systemd 的系统(Ubuntu 16.04+、Debian 8+、CentOS 7), 在配置文件 /etc/docker/daemon.json 中加入:

{
  "registry-mirrors": ["https://docker.mirrors.ustc.edu.cn/"]
}

接着重启docker:

sudo systemctl daemon-reload
sudo systemctl restart docker

验证docker hub 是否生效:

sudo docker info
#在结果中查看是否有如下结果:
Registry Mirrors:
    https://docker.mirrors.ustc.edu.cn/

在这里插入图片描述
也可以在阿里云申请自己的加速镜像 ,打开阿里云首页,点击弹性计算,再点击容器镜像服务,可能随着网页的改变,位置会发生改变,请自行查找。

在新打开的页面点击管理控制台:

接着进行登陆,如没有帐号,先注册再登陆: 选择如图中选项,获得个人的阿里云加速镜像。接着可以完成其它配置

1.3.3 Apt-get国内源设置

另外,进入docker 容器中,因为要使用apt-get update,所以同样要更新apt的国内源,两种方法图形界面依次打开:系统设置软件和更新。在 下载自 中选择 其他站点 ,然后在中国的条目 下选择 mirrors.ustc.edu.cn

另一种是,直接手动更改配置文件:

#选备份
sudo cp /etc/apt/sources.list /etc/apt/sources.list.bak
#将 /etc/apt/sources.list 文件中 Ubuntu 默认的源地址 http://archive.ubuntu.com/ 替换为 http://mirrors.ustc.edu.cn 即可,命令是:
sudo sed -i 's/archive.ubuntu.com/mirrors.ustc.edu.cn/g' /etc/apt/sources.list

也可以直接改/etc/apt/sources.list

sudo vim /etc/apt/sources.list
#以ubuntu16.04为例,内容换为
deb https://mirrors.ustc.edu.cn/ubuntu/ xenial main restricted universe multiverse
deb https://mirrors.ustc.edu.cn/ubuntu/ xenial-updates main restricted universe multiverse
deb https://mirrors.ustc.edu.cn/ubuntu/ xenial-backports main restricted universe multiverse
deb https://mirrors.ustc.edu.cn/ubuntu/ xenial-security main restricted universe multiverse
#源码仓库
deb-src https://mirrors.ustc.edu.cn/ubuntu/ xenial main restricted universe multiverse
deb-src https://mirrors.ustc.edu.cn/ubuntu/ xenial-updates main restricted universe multiverse
deb-src https://mirrors.ustc.edu.cn/ubuntu/ xenial-backports main restricted universe multiverse
deb-src https://mirrors.ustc.edu.cn/ubuntu/ xenial-security main restricted universe multiverse

更改完 sources.list 文件后请运行 sudo apt-get update 更新索引以生效。
如要用于其他版本,把 xenial 换成其他版本代号即可: 20.04:focal;18.04:bionic17.10:artful16.04:xenial14.04:trusty,也可以到https://mirrors.ustc.edu.cn/repogen/下载对应系统的sources.list。

2 、Nvidia Container Toolkit安装

首先,要保证Nvidia 显卡的驱动已经安装,请参见我的博客,里边有两种方法,推荐用第一种方法, 当然,也可以用第二种,从第二种也可以进入到nvidia官网,按照官网说明来安装(官网的不一定会安装成功,可能不适配系统)。
安装成功后,接着安装Nvidia Container Toolkit,该工具使Docker 的容器能与主机的Nvidia显卡进行interact.更多信息可以访问Nvidia Container Toolkit的官方网站,目前(2020年8月1日),安装前要求nvidia的驱动已安装,但不要求安装CUDA,同时,docker 版本是19.03(以后这个肯定要更新)

nvidia-smi #确认显卡驱动
docker -v #确认版本

在这里插入图片描述
接着开始安装:

# Add the package repositories
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -

上条命令如果输出:gpg: no valid OpenPGP data found.,可以多试几次,或者那么把命令分开执行:

curl -s -L -O https://nvidia.github.io/nvidia-docker/gpgkey #大写欧,会在本地保存一个gpgkey文件
sudo apt-key add gpgkey#会输出OK
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list

该命令成功后可以查看cat /etc/apt/sources.list.d/nvidia-docker.list,文个中会有如下内容:

deb https://nvidia.github.io/libnvidia-container/stable/ubuntu16.04/$(ARCH) /
#deb https://nvidia.github.io/libnvidia-container/experimental/ubuntu16.04/$(ARCH) /
deb https://nvidia.github.io/nvidia-container-runtime/stable/ubuntu16.04/$(ARCH) /
#deb https://nvidia.github.io/nvidia-container-runtime/experimental/ubuntu16.04/$(ARCH) /
deb https://nvidia.github.io/nvidia-docker/ubuntu16.04/$(ARCH) /

sudo apt-get update && sudo apt-get install -y nvidia-container-toolkit
#更新 使用如下安装 nvidia-container-toolkit 换成 nvidia-docker2
sudo apt-get install -y nvidia-docker2 
#####################或者分开执行#########################
sudo apt-get update 
sudo apt-get install -y nvidia-container-toolkit
########################################################
sudo systemctl restart docker
sudo docker run --gpus all --rm nvidia/cuda:10.0-base nvidia-smi 

如果有nvidia-smi信息输出成功,那么,表示安装成功。

  • 28
    点赞
  • 104
    收藏
    觉得还不错? 一键收藏
  • 12
    评论
### 回答1: 安装nvidia container toolkit的步骤如下: 1. 首先,需要安装Docker。可以通过以下命令安装: sudo apt-get update sudo apt-get install docker-ce docker-ce-cli containerd.io 2. 安装nvidia-docker2。可以通过以下命令安装: curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - distribution=$(. /etc/os-release;echo $ID$VERSION_ID) curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list sudo apt-get update sudo apt-get install -y nvidia-docker2 sudo systemctl restart docker 3. 安装nvidia-container-toolkit。可以通过以下命令安装: distribution=$(. /etc/os-release;echo $ID$VERSION_ID) curl -s -L https://nvidia.github.io/nvidia-container-toolkit/$distribution/nvidia-container-toolkit.list | sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list sudo apt-get update sudo apt-get install -y nvidia-container-toolkit sudo systemctl restart docker 安装完成后,可以通过运行以下命令来验证是否安装成功: docker run --gpus all nvidia/cuda:11.0-base nvidia-smi 如果输出类似于以下内容,则表示安装成功: +-----------------------------------------------------------------------------+ | NVIDIA-SMI 460.73.01 Driver Version: 460.73.01 CUDA Version: 11.2 | |-------------------------------+----------------------+----------------------+ | GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. | | | | MIG M. | |===============================+======================+======================| | 0 GeForce GTX 108... Off | 00000000:01:00.0 On | N/A | | 0% 37C P8 10W / 250W | 218MiB / 11172MiB | 0% Default | | | | N/A | +-------------------------------+----------------------+----------------------+ ### 回答2: nvidia container toolkit是一个用来管理在容器中运行的GPU应用程序的工具包。要安装nvidia container toolkit,需要遵循以下步骤: 1. 首先,确保您的系统具有NVIDIA驱动程序和Docker安装程序。可以访问 https://www.nvidia.com/Download/index.aspx?lang=en-us 查找适合您系统的驱动程序版本。Docker安装程序可以在https://docs.docker.com/engine/install/ubuntu/上下载。 2. 从NVIDIA官方源添加软件包存储库。在Ubuntu系统中,可以使用以下命令: curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - distribution=$(. /etc/os-release;echo $ID$VERSION_ID) curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list sudo apt-get update 3. 安装nvidia-container-toolkit软件包。使用以下命令: sudo apt-get install nvidia-container-toolkit 4. 为Docker配置nvidia-container-runtime。在Ubuntu系统中,可以通过编辑Docker配置文件/etc/docker/daemon.json来完成此操作。将以下 JSON 内容添加到该文件中: { "default-runtime": "nvidia", "runtimes": { "nvidia": { "path": "/usr/bin/nvidia-container-runtime", "runtimeArgs": [] } } } 5. 重新启动Docker守护进程。使用以下命令: sudo systemctl restart docker 6. 验证nvidia container toolkit是否安装成功。使用以下命令: docker run --rm --gpus all nvidia/cuda:11.0-base nvidia-smi 如果能够看到CUDA版本和GPU列表,则意味着nvidia container toolkit已经成功安装。 总之,安装nvidia container toolkit需要执行以上步骤。安装成功后,将能够在容器中运行GPU应用程序。 ### 回答3: Nvidia Container Toolkit是一个用于在Docker容器中使用Nvidia GPU的工具包,它提供了基本的Docker映像和容器管理,以及支持GPU硬件加速的CUDA运行时和驱动程序。 以下是安装Nvidia Container Toolkit的步骤: 1. 首先,确保您的系统上已安装最新版本的Docker。如果您的系统上没有安装Docker,请根据您的系统需求安装Docker。 2. 确认您的系统上已经安装Nvidia驱动程序和CUDA运行时。您可以从Nvidia官网上下载最新的驱动和CUDA运行时,然后按照安装指南进行安装。 3. 然后,通过运行以下命令来为Nvidia Docker仓库添加官方GPG密钥: $ curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | \ sudo apt-key add - 4. 再运行以下命令来添加Nvidia Docker仓库: $ distribution=$(. /etc/os-release;echo $ID$VERSION_ID) && \ curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | \ sudo tee /etc/apt/sources.list.d/nvidia-docker.list 5. 运行以下命令以更新软件包列表: $ sudo apt-get update 6. 最后,运行以下命令以安装Nvidia Container Toolkit: $ sudo apt-get install -y nvidia-docker2 这样,Nvidia Container Toolkit安装好了!现在,您就可以使用Nvidia GPUDocker容器中运行您的应用程序和工具了。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 12
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值