ubuntu安装docker配置pytorch环境、退出和启用进入容器、docker容器调用gpu报错、安装 NVIDIA Container Toolkit、容器调用gpu

weixin_44012667

已于 2024-04-23 22:18:43 修改

阅读量304

点赞数 2

文章标签： ubuntu docker pytorch

于 2024-04-23 18:47:16 首次发布

本文链接：https://blog.csdn.net/weixin_44012667/article/details/138135454

版权

1 配置：

Docker | 使用docker配置深度学习pytorch环境_docker pytorch-CSDN博客https://blog.csdn.net/weixin_44751294/article/details/123191429

2 docker-hub：

pytorch/pytorch - Docker Image | Docker Hubhttps://hub.docker.com/r/pytorch/pytorch/tags?page=&page_size=&ordering=&name=1.13.1

3 退出docker：

docker退出容器命令_mob64ca12f31496的技术博客_51CTO博客https://blog.51cto.com/u_16213442/7126352#:~:text=Docker%E9%80%80%E5%87%BA%E5%AE%B9%E5%99%A8%E5%91%BD%E4%BB%A4%201%20Ctrl%20%2B%20D%20%E7%BB%84%E5%90%88%E9%94%AE%EF%BC%9A%E5%9C%A8%E5%AE%B9%E5%99%A8%E4%B8%AD%E6%8C%89%E4%B8%8B%20Ctrl%20%2B,3%20docker%20attach%20%E5%91%BD%E4%BB%A4%EF%BC%9A%E4%BD%BF%E7%94%A8%20docker%20attach%20%E5%91%BD%E4%BB%A4%E5%8F%AF%E4%BB%A5%E9%87%8D%E6%96%B0%E8%BF%9B%E5%85%A5%E5%88%B0%E5%B7%B2%E7%BB%8F%E5%9C%A8%E5%90%8E%E5%8F%B0%E8%BF%90%E8%A1%8C%E7%9A%84%E5%AE%B9%E5%99%A8%E4%B8%AD%E3%80%82%20%E4%BE%8B%E5%A6%82%EF%BC%9A

4 docker的启动、运行：

https://blog.csdn.net/weixin_45052870/article/details/125507833https://blog.csdn.net/weixin_45052870/article/details/125507833

5 执行sudo docker run -it --name torch_gpu --gpus all pytorch/pytorch:1.13.1-cuda11.6-cudnn8-devel /bin/bash报错：
docker: Error response from daemon: could not select device driver "" with capabilities: [[gpu]].
ERRO[0000] error waiting for container: context canceled

解决方案：

Docker - 解决could not select device driver...gpu问题（安装nvidia-container-runtime） (hangge.com)https://www.hangge.com/blog/cache/detail_3184.html

6 安装 NVIDIA Container Toolkit ：

使用 Apt 安装

配置生产存储库：

curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \
&& curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \
sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \
sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list

（可选）配置存储库以使用实验包：

sed -i -e '/experimental/ s/^#//g' /etc/apt/sources.list.d/nvidia-container-toolkit.list

从存储库更新包列表：

sudo apt-get update

安装 NVIDIA Container Toolkit 软件包：

sudo apt-get install -y nvidia-container-toolkit

配置

先决条件

您安装了支持的容器引擎（Docker、Containerd、CRI-O、Podman）。

您安装了 NVIDIA Container Toolkit。

配置 Docker

使用 nvidia-ctk 命令配置容器run-time：

sudo nvidia-ctk runtime configure --runtime=docker

nvidia-ctk 命令修改主机上的 /etc/docker/daemon.json 文件。该文件更新以便 Docker 可以使用 NVIDIA 容器运行时。

重新启动 Docker 守护进程：

sudo systemctl restart docker

使用 Docker 运行示例工作负载，验证安装成功与否

运行示例 CUDA 容器：

sudo docker run --rm --runtime=nvidia --gpus all ubuntu nvidia-smi

您的输出应类似于以下输出：

参考信息详见：

Installing the NVIDIA Container Toolkit — NVIDIA Container Toolkit 1.15.0 documentation --- 安装 NVIDIA Container Toolkit — NVIDIA Container Toolkit 1.15.0 文档https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/latest/install-guide.html

7 容器调用gpu：

sudo docker run -it --name torch_gpu --gpus all pytorch/pytorch:1.13.1-cuda11.6-cudnn8-devel /bin/bash

updating：20240423

weixin_44012667

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
ubuntu安装docker配置pytorch环境、退出和启用进入容器、docker容器调用gpu报错、安装 NVIDIA Container Toolkit、容器调用gpu

配置：nullnull。
复制链接

扫一扫