任务:将训练好的网络模型通过docker镜像打包,别人再使用时就不需要配置环境。
1. 从docker hub网站上pull 合适的基础镜像
docker pull pytorch/pytorch:latest
2. 通过镜像生成一个容器
nvidia-docker run -it --name image_new_name Image_orignal_name
- nvidia-docker 表示创建的这个容器可以自动配置GPU(也就是程序可以跑在GPU上),如果是用docker 创建容器的话,默认程序跑在CPU上。
- 有时会看到在这个语句里加入 [-v 本地路径:容器路径],它将本地路径里的所有文件挂载(我的理解是映射,具有同步性)到容器路径里面。但要注意的是:该容器一旦被用来生成新的镜像,挂载的文件不会出现在用该新镜像生成的容器里。
3. 查看生成的容器 ID
docker ps -a
- -a 表示显示所有容器,无论是正在运行的还是未运行的。
4. 将训练好的模型文件以及相关代码从本地复制到容器里
docker cp local_path container_ID:container:path
5. 运行该容器,并进入bash界面
docker start container_ID #启动容器
docker exec -it container_ID /bin/bash #进入bash界面
6. 在该容器里测试训练好的模型是否可以正常运行
7. 将该容器生成新的镜像
docker commit container_ID your_image_name #比如 your_image_name = my/image:v1
- 如果用 docker export container_ID > XXX.tar 的话,用该镜像生成容器(步骤2)的时候需要加上/bin/bash,否则会失败。
8. 打包新镜像
docker save image_ID > XXX.tar
9. 测试别人是否可以正常使用该新镜像
cat XXX.tar | docker import - my/image:v1
重复步骤2,6即可。