ubuntu安装docker配置pytorch环境、退出和启用进入容器、docker容器调用gpu报错、安装 NVIDIA Container Toolkit、容器调用gpu

1 配置:

Docker | 使用docker配置深度学习pytorch环境_docker pytorch-CSDN博客icon-default.png?t=N7T8https://blog.csdn.net/weixin_44751294/article/details/123191429

2 docker-hub:

pytorch/pytorch - Docker Image | Docker Hubicon-default.png?t=N7T8https://hub.docker.com/r/pytorch/pytorch/tags?page=&page_size=&ordering=&name=1.13.1

3 退出docker:

docker退出容器命令_mob64ca12f31496的技术博客_51CTO博客icon-default.png?t=N7T8https://blog.51cto.com/u_16213442/7126352#:~:text=Docker%E9%80%80%E5%87%BA%E5%AE%B9%E5%99%A8%E5%91%BD%E4%BB%A4%201%20Ctrl%20%2B%20D%20%E7%BB%84%E5%90%88%E9%94%AE%EF%BC%9A%E5%9C%A8%E5%AE%B9%E5%99%A8%E4%B8%AD%E6%8C%89%E4%B8%8B%20Ctrl%20%2B,3%20docker%20attach%20%E5%91%BD%E4%BB%A4%EF%BC%9A%E4%BD%BF%E7%94%A8%20docker%20attach%20%E5%91%BD%E4%BB%A4%E5%8F%AF%E4%BB%A5%E9%87%8D%E6%96%B0%E8%BF%9B%E5%85%A5%E5%88%B0%E5%B7%B2%E7%BB%8F%E5%9C%A8%E5%90%8E%E5%8F%B0%E8%BF%90%E8%A1%8C%E7%9A%84%E5%AE%B9%E5%99%A8%E4%B8%AD%E3%80%82%20%E4%BE%8B%E5%A6%82%EF%BC%9A

4 docker的启动、运行:

https://blog.csdn.net/weixin_45052870/article/details/125507833icon-default.png?t=N7T8https://blog.csdn.net/weixin_45052870/article/details/125507833

5 执行sudo docker run -it --name torch_gpu --gpus all pytorch/pytorch:1.13.1-cuda11.6-cudnn8-devel /bin/bash报错:
docker: Error response from daemon: could not select device driver "" with capabilities: [[gpu]].
ERRO[0000] error waiting for container: context canceled

解决方案:

Docker - 解决could not select device driver...gpu问题(安装nvidia-container-runtime) (hangge.com)icon-default.png?t=N7T8https://www.hangge.com/blog/cache/detail_3184.html

6 安装 NVIDIA Container Toolkit :

使用 Apt 安装

配置生产存储库:

curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \
  && curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \
    sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \
    sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list

(可选)配置存储库以使用实验包:

sed -i -e '/experimental/ s/^#//g' /etc/apt/sources.list.d/nvidia-container-toolkit.list

从存储库更新包列表:

sudo apt-get update

安装 NVIDIA Container Toolkit 软件包:

sudo apt-get install -y nvidia-container-toolkit

配置

先决条件

您安装了支持的容器引擎(Docker、Containerd、CRI-O、Podman)。

您安装了 NVIDIA Container Toolkit。

配置 Docker

使用 nvidia-ctk 命令配置容器run-time:

sudo nvidia-ctk runtime configure --runtime=docker

nvidia-ctk 命令修改主机上的 /etc/docker/daemon.json 文件。该文件更新以便 Docker 可以使用 NVIDIA 容器运行时。

重新启动 Docker 守护进程:

sudo systemctl restart docker

使用 Docker 运行示例工作负载,验证安装成功与否

运行示例 CUDA 容器:

sudo docker run --rm --runtime=nvidia --gpus all ubuntu nvidia-smi

您的输出应类似于以下输出:

参考信息详见:

Installing the NVIDIA Container Toolkit — NVIDIA Container Toolkit 1.15.0 documentation --- 安装 NVIDIA Container Toolkit — NVIDIA Container Toolkit 1.15.0 文档icon-default.png?t=N7T8https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/latest/install-guide.html

7 容器调用gpu:

sudo docker run -it --name torch_gpu --gpus all pytorch/pytorch:1.13.1-cuda11.6-cudnn8-devel /bin/bash

updating:20240423

  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值