环境说明:使用ubuntu18.04 ,4Gpu
1、下载docker
docker官网:https://www.docker.com/
docker的官方文档:https://docs.docker.com/
https://docs.docker.com/install/linux/docker-ee/ubuntu/
docker的官方文档的右边这里可以找到对应系统的安装的官方教程
需要注意一下,docker也有社区版和专业版的区别的,我下载的是CE版,就是社区版
接下来是安装流程,具体的步骤详解可以参考官方文档,我这里就是操作的记录
2、卸载旧版本
sudo apt-get remove docker docker-engine docker.io containerd runc
3、使用存储库安装
sudo apt-get update
sudo apt-get install apt-transport-https ca-certificates curl gnupg-agent software-properties-common
4、添加Docker的官方GPG密
curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add -
sudo apt-key fingerprint 0EBFCD88
5、设置稳定存储库
sudo add-apt-repository "deb [arch=amd64] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable
有点看不懂这个稳定设置
6、安装DOCKER ENGINE - 社区
sudo apt-get update
sudo apt-get install docker docker-compose
7、通过运行hello-world
映像验证是否正确安装
sudo docker run hello-world
8、NVIDIA-dockr
看看链接
https://blog.csdn.net/Diana_Z/article/details/100011628
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------
-------------------------------------------重点分割线,下面是caffe安装----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------
1、caffe官网的docker安装指南
https://github.com/BVLC/caffe/tree/master/docker
2、将caffe的docker镜像pull下来
sudo docker pull bvlc/caffe:gpu
3、dockre权限
docker刚刚安装好的时候权限是在root下面的,所以在执行docker命令的时候需要使用sudo前缀
如果没有sudo会这样
cj1@cj1-All-Series:~$ docker pull bvlc/caffe:gpu
Got permission denied while trying to connect to the Docker daemon socket at unix:///var/run/docker.sock: Post http://%2Fvar%2Frun%2Fdocker.sock/v1.39/images/create?fromImage=bvlc%2Fcaffe&tag=gpu: dial unix /var/run/docker.sock: connect: permission deniedPldmU
4、修改权限
在非终端使用的doker环境下,sudo是没法输入的,所以最好是将当前用户添加到docker的组里面
参考:https://www.cnblogs.com/informatics/p/8276172.html
命令:
我参考的是参考网址里面的方法二
执行效果:
需要注意的是,这个时候你在当前的终端里面权限已经添加了
但是重新打开一个终端,权限又会消失
这个时候注销用户再次登录,或者重启计算机就可以。重启之后就可以了
5、使用镜像创建容器
查看容器中的镜像:
docker images
创建caffe的容器:
docker run -t -i bvlc/caffe:gpu /bin/bashmo
前面的aad048ad243fd243f就是容器的id
退出容器:
在容器中输入exit
6、验证容器中的caffe是否可以使用
验证python是否可以inport caffe
7、运行一个mnist例子
首先,caffe的官方docker里面的caffe文件在/opt/目录下
然后按照例子执行的三步走:下载数据------数据转格式------训练
进入/opt/caffe/data/mnist目录下运行脚本文件get_mnist.sh
在caffe目录下面执行转数据格式
./examples/mnist/create_mnist.sh
8、训练模型
9、提交修改过后的容器到新的本地镜像
docker commit -m 'down load mnist date' -a 'dianazhang' f3f1a69e9595 caffe-mnist
//down load mnist date 是注释内容
//dianazhang 提交用户
//f3f1a69e9595 容器id
//caffe-mnist 新的镜像的名字
查看的时候就有caffe-mnist这个镜像了