为何需要存储卷
Docker镜像由多个只读层叠加而成,启动容器时,Docker会加载只读镜像层并在镜像栈顶部添加一个读写层。
如果运行中的容器修改了现有的一个已经存在的文件,那该文件将会从读写层下面的只读层复制到读写层,该文件的只读版本仍然存在,只是已经被读写层中该文件的副本所隐藏,这个就是写时复制(COW)机制。
数据存储的问题
Docker 容器数据的存储,存在以下问题:
- 存储于联合文件系统中,不易于宿主机访问
- 容器间数据共享不便
- 删除容器其数据会丢失
关闭并重启容器,容器的数据不受影响。但删除容器会是之前的更改全部丢失。
解决方案:卷(volume),或者便于区分叫做存储卷。
卷是容器上的一个或多个目录,此类目录可绕过联合文件系统,与宿主机上的某个目录绑定(关联)。
Data volumes
Volume在容器初始化之时就会创建,由base image提供的卷中的数据会于此期间完成复制。
Volumn的初衷就是独立于容器的生命周期实现数据持久化,因此删除容器之时既不会删除卷,也不会对哪怕未被引用的卷做垃圾回收操作。
卷为docker提供了独立于容器的数据管理机制:
- 可以把镜像想象成静态文件,例如程序。把卷类比为动态内容,例如数据。于是,镜像可以重用,而卷可以共享
- 卷实现了程序(镜像)和数据(卷)的分离,以及程序(镜像)和制作镜像的主机的分离。用户制作镜像时无须再考虑镜像运行的容器所在主机的环境。
在容器中使用volumes
现在,在创建容器时,加上volumes的相关选项。
Volumes types
Docker有两种类型的卷,每种类型都在容器中存在一个挂载点,但是在宿主机上的位置有所不同:
- Bind-mount volume: 容器内的目录和宿主机上的目录都需要指定
- Docker-managed volume: 容器内的目录需要指定,宿主机上目录由docker维护
为docker run命令使用-v选项,即可使用Volume。
Docker-managed volume
开一个会话创建容器并绑定volume:
$ docker run --name v1 --rm -it -v /data busybox
在宿主机上操作目录
在另一个会话中查询这个容器的inspect,不过内容比较多。在Volumes里能看到卷的信息:
"Volumes": {
"/data": {}
},
还有挂载点的信息,这里使用-f参数只看Mounts的内容:
$ docker inspect -f '{{json .Mounts}}' v1
[{"Type":"volume","Name":"bdd48fb729e802b7d3a067da74b748037e83ff770a84f7215c657f6cc2af2c9d","Source":"/var/lib/docker/volumes/bdd48fb729e802b7d3a067da74b748037e83ff770a84f7215c657f6cc2af2c9d/_data","Destination":"/data","Driver":"local","Mode":"","RW":true,"Propagation":""}]
$
宿主机自动分配的卷的路径在Source字段中,下面的方法直接获取路径并调用ls命令:
$ docker inspect -f '{{range .Mounts}}{{.Source}} {{end}}' v1 | xargs ls
$ docker inspect -f '{{with index .Mounts 0}}{{.Source}}{{end}}' v1 | xargs ls
Mounts里是一个数组,可能有多个挂载点。第一行的命令是遍历所有的目录,第二行的命令是只输出第一个目录。
在挂载点的目录中,容器和宿主机可以共享数据。容器中对目录的修改,在宿主机中可以查看到。反之,在宿主机中对这个目录的修改,容器也能够查看到。
删除镜像
上面创建容器的命令使用了--rm参数,这样一旦容器停止,该容器也就会自动被删除。容器删除后,Docker-managed volume也会一并被删除。
所以这是一个临时的卷,卷内存储的数据依然会随着容器的删除而丢失。没有解决容器内数据持久保存的目的,但是现在容器的数据可以和宿主机共享,并且数据存储的I/O也直接是由宿主机的文件系统决定。好处是用户不用额外来管理这个卷,卷内存放的临时数据会随着容器的删除而删除。适合用于存放临时性的但是需要在容器外的共享的数据。
Bind-mount Volme
使用的参数还是和之前一样,但是-v参数的内容提供两部分,宿主机的目录和卷的目录,中间用冒号分隔:-v HOSTDIR:VOLUMEDIR
。
绑定 Bind-mount Volme
开一个会话创建容器并绑定Bind-mount Volme:
$ docker run --name v2 --rm -it -v ~/data/volumes/v2:/data busybox
仍然可以使用docker inspect命令来查看详细信息,这里就不演示了。
这里指定的宿主机的路径如果不存在,docker会自动创建。
删除容器
容器删除后,宿主机上的文件会依然存在。这样就实现了数据在容器删除后依然可以使用。
共享卷
前面说了,docker有两种类型的卷,两种都已经说了。这里的共享卷本质上还是上面两种类型中的某一种,只是是实现了容器间共享同一个卷的两种方法。
多个容器卷使用同一个主机目录
这个没什么问题,主机上同一个目录是允许被多个容器同时使用的。
复制使用其他容器的卷
使用--volumes-from选项:
$ docker run --name v3.0 --rm -itd -v /data busybox
e24397fffb44717a7f140010c829ec88f540ed7d95f7c8fb328a35a819becfb0
$ docker run --name v3.1 --rm -itd --volumes-from v3.0 busybox
28543eb6fc13e972a000ab955b9623630ebb9d90c8d3dc37a8b7608f24188926
$ docker container attach v3.0
/ # touch /data/test_v3_0
/ # exit
$ docker container attach v3.1
/ # ls /data
test_v3_0
/ # exit
$
这里的示例复制的是Docker-managed volume,对于Bind-mount Volme也是一样的。
共享网络
网络也可以共享,即联盟式网络。这里,卷也可以共享。在有些场景下,两个或几个容器有可能需要共享同一个网络并且共享同一个卷。