Docker构建和使用
1.构建dockerfile文件 实例
# 基础镜像
FROM nvcr.io/nvidia/cuda:12.1.0-runtime-ubuntu20.04
# 安装依赖项 和python-dev
RUN apt-get update && \
apt-get install --no-install-recommends -y python3-pip python3.8-dev vim git build-essential
# Set python3.8 as default
RUN ln -s /usr/bin/python3 /usr/bin/python
# 需要准备好 torch 等whl 进行安装对应python环境
COPY ./whl/torch-1.13.1+cu116-cp38-cp38-linux_x86_64.whl /tmp/torch-1.13.1+cu116-cp38-cp38-linux_x86_64.whl
RUN pip install /tmp/torch-1.13.1+cu116-cp38-cp38-linux_x86_64.whl
RUN rm /tmp/torch-1.13.1+cu116-cp38-cp38-linux_x86_64.whl
如果获取CUDA镜像 可以在https://hub.docker.com/r/nvidia/cuda/tags中自主选择
whl离线版本在http://download.pytorch.org/whl/torch_stable.html中可获得 ,搜索相关版本CU121
2. 安装镜像(注意:不要忘记最后的小数点,代表当前目录)
docker build -t target:v1 .
3. 镜像内部调试算法
会打开一个bash窗口,在该窗口里运行算法,查看是否有缺失的依赖
- 千万记住:启动Docker后,在Docker内部修改代码是并不会保存的,需要在原始算法端重新修改。或者启动自动挂载的docker
docker run -v /home/bf/:/app -it --gpus "device=7" --rm target:v1 /bin/bash
conda自动安装 无需手动输入y conda install -y