pytorch docker GPU环境安装

一.确保nvidia-docker安装
查看系统版本
root@3a7dee2ecfb3:/# cat /etc/issue
Ubuntu 16.04.6 LTS \n \l
切换docker镜像
systemctl daemon-reload 
systemctl restart docker

查看cuda和cudnn版本
[root@bogon pytorch]# cat /usr/local/cuda/version.txt
CUDA Version 9.1.85
[root@bogon pytorch]# cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
#define CUDNN_MAJOR 7
#define CUDNN_MINOR 0
#define CUDNN_PATCHLEVEL 5
--
#define CUDNN_VERSION    (CUDNN_MAJOR * 1000 + CUDNN_MINOR * 100 + CUDNN_PATCHLEVEL)

#include "driver_types.h"
二.创建带GPU驱动的容器
docker pull nvidia/cuda:9.1-runtime-ubuntu16.04
创建docker训练环境
内存必须够
nvidia-docker run -i -t -d -p 8090:8888 -p 6090:6006 --shm-size 10G  -v /data/ml:/ml --name=cuda9.1_anaconda3 docker.io/nvidia/cuda:9.1-runtime-ubuntu16.04 bash
三、安装常用软件
nvidia-smi查看显卡
apt-get update
apt-get install vim

export PATH="/home/<user>/anaconda3/bin:$PATH"
source ~/.bashrc

conda config 命令 生成 .condarc文件
修改~/.condarc文件源
四.安装pytorch
cudatoolkit版本必须和nvidia driver版本兼容
conda install pytorch==1.1.0 torchvision==0.3.0 cudatoolkit=9.0 -c pytorch
验证
import torch
torch.cuda.is_available()
torch.backends.cudnn.enabled
安装matplotlib
conda install matplotlib
添加jupyter内核
conda install ipykernel
python -m ipykernel install --user --name pytorch1.1_py3.7 --display-name "pytorch1.1_py3.7"


mkdir /ml/notebooks
nohup /ml/anaconda3/envs/pytorch1.1_py3.7/bin/jupyter notebook --notebook-dir=/ml/notebooks --ip='*' --port=8888 --no-browser --allow-root > jupyter-notebook.log 2>&1 &

你可以按照以下步骤来搭建一个GPU版本的PyTorch Docker镜像: 1. 首先,确保你的机器上已经安装了NVIDIA驱动程序。可以使用以下命令来检查驱动程序的安装情况: ``` nvidia-smi ``` 2. 安装Docker和NVIDIA Docker运行时。根据你的操作系统,可以按照官方文档的说明进行安装。 3. 创建一个新的Dockerfile,可以使用以下命令在你的项目目录中创建一个名为Dockerfile的文件: ``` touch Dockerfile ``` 4. 使用任何文本编辑器打开Dockerfile,并将以下内容添加到文件中: ```dockerfile # 指定基础镜像 FROM pytorch/pytorch:latest # 安装CUDA工具包 RUN apt-get update && apt-get install -y --no-install-recommends \ cuda-toolkit-11-0 \ && rm -rf /var/lib/apt/lists/* # 设置环境变量 ENV PATH /usr/local/nvidia/bin:${PATH} ENV LD_LIBRARY_PATH /usr/local/nvidia/lib:/usr/local/nvidia/lib64:${LD_LIBRARY_PATH} # 安装PyTorch和Torchvision RUN pip install torch==1.9.0+cu111 torchvision==0.10.0+cu111 -f https://download.pytorch.org/whl/torch_stable.html # 设置工作目录 WORKDIR /app # 复制项目文件到镜像中 COPY . /app # 安装项目依赖 RUN pip install -r requirements.txt # 设置启动命令 CMD ["python", "main.py"] ``` 请注意,上面的Dockerfile使用了pytorch/pytorch:latest作为基础镜像,并安装CUDA工具包以支持GPU计算。你可以根据你的需求选择不同的基础镜像和CUDA版本。 5. 在同一个目录中创建一个名为requirements.txt的文件,并列出你项目所需的所有Python依赖包。 6. 确保你的项目文件(包括Dockerfile和requirements.txt)都在同一个目录中。 7. 打开终端,导航到包含Dockerfile和requirements.txt的目录,并执行以下命令来构建Docker镜像: ``` docker build -t my_pytorch_image . ``` 这将使用Dockerfile中的指令构建一个名为my_pytorch_image的镜像。确保在命令末尾有一个点,表示Dockerfile所在的当前目录。 8. 构建完成后,你可以使用以下命令来运行一个容器并使用GPU: ``` docker run --gpus all -it my_pytorch_image ``` 这将创建一个新的容器并进入交互模式,你可以在其中运行你的PyTorch代码,并利用GPU进行加速。 希望这些步骤能帮助你搭建一个GPU版本的PyTorch Docker镜像!如果有任何问题,请随时提问。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值