通过安装NVIDIA Container Toolkit在Docker中使用GPU

通过安装NVIDIA Container Toolkit在Docker中使用GPU

NVIDIA Container Toolkit

NVIDIA Container Toolkit允许用户构建和运行GPU加速Docker容器。该工具包包括一个容器运行时库和实用程序,用于自动配置容器以利用NVIDIA GPU。
NVIDIA Container Toolkit允许在生态系统中使用不同的容器引擎。
在这里插入图片描述

前提

  1. 安装了NVIDIA驱动
  2. 安装了Docker
  3. 不需要安装CUDA(CUDA Toolkit)

安装可以参考链接:DockerNVIDIA驱动

你的驱动版本可能会限制你的CUDA能力。较新的NVIDIA驱动程序向后兼容CUDA工具包版本,但是CUDA的每个新版本都需要一个最低的驱动程序版本。运行CUDA容器需要一台机器,至少有一个支持CUDA的GPU和一个与您正在使用的CUDA工具包版本兼容的驱动程序。

CUDA的和最小兼容驱动版本对应表

注意:从CUDA 11.0开始,工具包组件单独进行版本控制,工具包本身的版本控制如下表所示。
在这里插入图片描述

安装

设置NVIDIA Container Toolkit的stable版本存储库的GPG key:

distribution=$(. /etc/os-release;echo $ID$VERSION_ID) \
   && curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - \
   && curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list
sudo apt-get update && sudo apt-get install -y nvidia-container-toolkit
sudo systemctl restart docker

有关NVIDIA Container Toolkit入门的说明,请参阅安装指南

使用

docker run --rm --gpus all nvidia/cuda:11.0-base nvidia-smi

--rm:当容器退出时自动移除它
在这里插入图片描述上面这行代码,运行完之后输出nvidia-smi命令的相关信息之后就退出了,并且退出之后就把容器删除了。
但是明明下载的是cuda:11.0的容器,怎么显示的却是11.2的,进入容器看看:

docker run -it --name nvidia_docker --gpus all nvidia/cuda:11.0-base

-it:交互模式运行容器,并分配一个终端
--name:指定容器名称。容器在运行之后会自动分配ID,并且有个随机的name,可以指定名称,有时会很方便
--gpus:指定GPU,有多种指定方式。
在这里插入图片描述

虽然没有看到什么资料,但是猜测nvidia-smi显示的CUDA Version: 11.2应该指的是这个驱动支持的最新版本的CUDA,而非安装的CUDA。应该这样理解才对

用户指南提供了在使用Docker运行GPU容器时可用的配置和命令行选项的信息。

参考链接

nvidia-docker
安装指南
用户指南

  • 8
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 3
    评论
### 回答1: 安装nvidia container toolkit的步骤如下: 1. 首先,需要安装Docker。可以通过以下命令安装: sudo apt-get update sudo apt-get install docker-ce docker-ce-cli containerd.io 2. 安装nvidia-docker2。可以通过以下命令安装: curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - distribution=$(. /etc/os-release;echo $ID$VERSION_ID) curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list sudo apt-get update sudo apt-get install -y nvidia-docker2 sudo systemctl restart docker 3. 安装nvidia-container-toolkit。可以通过以下命令安装: distribution=$(. /etc/os-release;echo $ID$VERSION_ID) curl -s -L https://nvidia.github.io/nvidia-container-toolkit/$distribution/nvidia-container-toolkit.list | sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list sudo apt-get update sudo apt-get install -y nvidia-container-toolkit sudo systemctl restart docker 安装完成后,可以通过运行以下命令来验证是否安装成功: docker run --gpus all nvidia/cuda:11.0-base nvidia-smi 如果输出类似于以下内容,则表示安装成功: +-----------------------------------------------------------------------------+ | NVIDIA-SMI 460.73.01 Driver Version: 460.73.01 CUDA Version: 11.2 | |-------------------------------+----------------------+----------------------+ | GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. | | | | MIG M. | |===============================+======================+======================| | 0 GeForce GTX 108... Off | 00000000:01:00.0 On | N/A | | 0% 37C P8 10W / 250W | 218MiB / 11172MiB | 0% Default | | | | N/A | +-------------------------------+----------------------+----------------------+ ### 回答2: nvidia container toolkit是一个用来管理在容器运行的GPU应用程序的工具包。要安装nvidia container toolkit,需要遵循以下步骤: 1. 首先,确保您的系统具有NVIDIA驱动程序和Docker安装程序。可以访问 https://www.nvidia.com/Download/index.aspx?lang=en-us 查找适合您系统的驱动程序版本。Docker安装程序可以在https://docs.docker.com/engine/install/ubuntu/上下载。 2. 从NVIDIA官方源添加软件包存储库。在Ubuntu系统,可以使用以下命令: curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - distribution=$(. /etc/os-release;echo $ID$VERSION_ID) curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list sudo apt-get update 3. 安装nvidia-container-toolkit软件包。使用以下命令: sudo apt-get install nvidia-container-toolkit 4. 为Docker配置nvidia-container-runtime。在Ubuntu系统,可以通过编辑Docker配置文件/etc/docker/daemon.json来完成此操作。将以下 JSON 内容添加到该文件: { "default-runtime": "nvidia", "runtimes": { "nvidia": { "path": "/usr/bin/nvidia-container-runtime", "runtimeArgs": [] } } } 5. 重新启动Docker守护进程。使用以下命令: sudo systemctl restart docker 6. 验证nvidia container toolkit是否安装成功。使用以下命令: docker run --rm --gpus all nvidia/cuda:11.0-base nvidia-smi 如果能够看到CUDA版本和GPU列表,则意味着nvidia container toolkit已经成功安装。 总之,安装nvidia container toolkit需要执行以上步骤。安装成功后,将能够在容器运行GPU应用程序。 ### 回答3: Nvidia Container Toolkit是一个用于在Docker容器使用Nvidia GPU的工具包,它提供了基本的Docker映像和容器管理,以及支持GPU硬件加速的CUDA运行时和驱动程序。 以下是安装Nvidia Container Toolkit的步骤: 1. 首先,确保您的系统上已安装最新版本的Docker。如果您的系统上没有安装Docker,请根据您的系统需求安装Docker。 2. 确认您的系统上已经安装Nvidia驱动程序和CUDA运行时。您可以从Nvidia官网上下载最新的驱动和CUDA运行时,然后按照安装指南进行安装。 3. 然后,通过运行以下命令来为Nvidia Docker仓库添加官方GPG密钥: $ curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | \ sudo apt-key add - 4. 再运行以下命令来添加Nvidia Docker仓库: $ distribution=$(. /etc/os-release;echo $ID$VERSION_ID) && \ curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | \ sudo tee /etc/apt/sources.list.d/nvidia-docker.list 5. 运行以下命令以更新软件包列表: $ sudo apt-get update 6. 最后,运行以下命令以安装Nvidia Container Toolkit: $ sudo apt-get install -y nvidia-docker2 这样,Nvidia Container Toolkit安装好了!现在,您就可以使用Nvidia GPUDocker容器运行您的应用程序和工具了。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

ayiya_Oese

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值