docker存储卷
文章目录
COW机制 (copy write 写时复制 )
Docker镜像由多个只读层叠加而成,启动容器时,Docker会加载只读镜像层并在镜像栈顶部添加一个读写层。
如果运行中的容器修改了现有的一个已经存在的文件,那么该文件将会从读写层下面的只读层复制到读写层,该文件的只读版本依然存在,只是已经被读写层中该文件的副本所隐藏,这就是“写时复制(COW)”机制。
对于这种方式来说,我们去访问一个文件,修改和删除等一类的操作,其效率会非常的低,因为隔着很多层镜像。
而要想绕过这种限制,我们可以通过使用存储卷的机制来实现。
什么是存储卷
存储卷就是将宿主机的本地文件系统中存在的某个目录直接与容器内部的文件系统上的某一目录建立绑定关系。这就意味着,当我们在容器中的这个目录下写入数据时,容器会将其内容直接写入到宿主机上与此容器建立了绑定关系的目录。
在宿主机上的这个与容器形成绑定关系的目录被称作存储卷。
使用存储卷的好处
如果容器中跑的进程的所有有效数据都保存在存储卷中,从而脱离容器自身文件系统之后,带来的好处是当容器关闭甚至被删除时,只要不删除与此容器绑定的在宿主机上的这个存储目录,我们就不用担心数据丢失了。因此就可以实现数据持久,脱离容器的生命周期而持久。
我们通过这种方式管理容器,容器就可以脱离主机的限制,可以在任意一台部署了docker的主机上跑容器,而其数据则可以置于一个共享存储文件系统上,比如nfs。
Docker的存储卷默认情况下是使用其所在的宿主机上的本地文件系统目录的,也就是说宿主机上有一块属于自己的硬盘,这个硬盘并没有共享给其他的Docker主机,而在这台主机上启动的容器所使用的存储卷是关联到此宿主机硬盘上的某个目录之上。
这就意味着容器在这台主机上停止运行或者被删除了再重建,只要关联到硬盘上的这个目录下,那么其数据还存在。但如果在另一台主机上启动一个新容器,那么数据就没了。而如果在创建容器的时候我们手动的将容器的数据挂载到一台nfs服务器上,那么这个问题就不再是问题了。
为什么要用存储卷
关闭并重启容器,其数据不受影响,但删除Docker容器,则其更改将会全部丢失。
因此Docker存在的问题有:
- 存储于联合挂载文件系统中,不易于宿主机访问
- 容器间数据共享不便
- 删除容器其数据会丢失
而要解决这些问题,解决方案就是使用存储卷。
存储卷管理方式
存储卷(Data Volume)于容器初始化时被自动创建,由base image提供的卷中的数据会于此期间完成复制。
Volume的初衷是独立于容器的生命周期实现数据持久化,因此删除容器之时既不会删除卷,也不会对未被引用的卷做垃圾回收操作。
存储卷为Docker提供了独立于容器的数据管理机制,我们可以把镜像想象成静态文件,例如“程序”,把卷类比为动态内容,例如“数据”。所以镜像可以重用,而卷则可以共享。
卷实现了“程序(镜像)”和“数据(卷)”的分离,以及“程序(镜像)”和“制作镜像的主机”的分离,用户制作镜像时无须再考虑镜像运行的容器所在的主机的环境。
存储卷的分类
Docker有两种类型的卷,每种类型都在容器中存在一个挂载点,但其在宿主机上的位置有所不同:
- Bind mount volume
- a volume that points to a user-specified location on the host file system
- Docker-managed volume
- the Docker daemon creates managed volumes in a portion of the host’s file system that’s owned bye Docker
- the Docker daemon creates managed volumes in a portion of the host’s file system that’s owned bye Docker
容器数据管理
用户在使用Docker的过程中,往往需要能查看容器内应用产生的数据,或者需要把容器内的数据进行备份,甚至多个容器之间进行数据的共享,这必然涉及容器的数据管理操作。
容器中管理数据主要有两种方式:
- 数据卷(Data Volumes)
- 数据卷容器(Data Volumes Containers)
容器Volume使用语法:
Docker-managed volume
//终端1上
[root@localhost ~]# docker run -it --rm --name b1 -v /data busybox /bin/sh
Unable to find image 'busybox:latest' locally
latest: Pulling from library/busybox
5cc84ad355aa: Pull complete
Digest: sha256:5acba83a746c7608ed544dc1533b87c737a0b0fb730301639a0179f9344b1678
Status: Downloaded newer image for busybox:latest
/ # ls
bin data dev etc home proc root sys tmp usr var
/ # ls /data/
/ # cd /data/
/data # ls
/data # echo "hello" > a.txt
/data # cat a.txt
hello
//终端二上
[root@localhost ~]# docker ps
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
889145c8fe6a busybox "/bin/sh" 9 minutes ago Up 9 minutes b1
[root@localhost ~]# docker inspect b1
......
"Mounts": [
{
"Type": "volume",
"Name": "e5ae1aaa4d32e40a0be9f2e5026b7fde02252df3ec47910f1350130464489781",
"Source": "/var/lib/docker/volumes/e5ae1aaa4d32e40a0be9f2e5026b7fde02252df3ec47910f1350130464489781/_data",
"Destination": "/data",
"Driver": "local",
......
[root@localhost ~]# cd /var/lib/docker/volumes/e5ae1aaa4d32e40a0be9f2e5026b7fde02252df3ec47910f1350130464489781/_data
[root@localhost _data]# ls
a.txt
[root@localhost _data]# cat a.txt
hello
//终端1上
/data # rm -rf a.txt
/data # ls
//终端2上
[root@localhost _data]# ls
[root@localhost _data]# touch b.txt
[root@localhost _data]# ls
b.txt
//终端一
/data # ls
b.txt
[root@localhost _data]# touch abc
touch: cannot touch 'abc': No such file or directory //当容器停止运行或被删除后,就无法进行操作了,这就是容器管理数据卷
[root@localhost _data]# ls
Bind mount volume
//终端1上
[root@localhost ~]# docker run -it --rm --name b2 -v /web:/data busybox
/ # ls
bin data dev etc home proc root sys tmp usr var
/ # ls /data
//终端2上
[root@localhost ~]# ls /
bin boot dev etc home lib lib64 media mnt opt proc root run sbin srv sys tmp usr var web
[root@localhost ~]# cd /web
[root@localhost web]# ls
[root@localhost web]# echo 'haha' > abc.txt
[root@localhost web]# ls
abc.txt
[root@localhost web]# cat abc.txt
haha
//终端1上可以看到内容存在了
/ # ls data/
abc.txt
/ # cd /data
/data # cat abc.txt
haha
/data # exit
[root@localhost ~]# docker ps -a
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
[root@localhost ~]# docker run -it --rm --name b3 -v /web:/data busybox
/ # ls
bin data dev etc home proc root sys tmp usr var
/ # ls data/
abc.txt
/ # cd /data
/data # cat abc.txt
haha
//终端2
[root@localhost web]# ls
abc.txt
[root@localhost web]# cat abc.txt
haha
部署一个网站
[root@localhost ~]# cd /web
[root@localhost web]# ls
abc.txt
[root@localhost web]# ls
abc.txt zhuawawaji.zip
[root@localhost web]# yum install -y unzip
......
Complete!
[root@localhost web]# unzip zhuawawaji.zip
......
[root@localhost web]# ls
abc.txt jQuery抓娃娃机游戏代码 zhuawawaji.zip
[root@localhost web]# mv jQuery抓娃娃机游戏代码/* .
[root@localhost web]# ls
abc.txt images img index.html jQuery抓娃娃机游戏代码 js zhuawawaji.zip
//终端1
le to find image 'httpd:latest' locally
latest: Pulling from library/httpd
a2abf6c4d29d: Pull complete
dcc4698797c8: Pull complete
41c22baa66ec: Pull complete
67283bbdd4a0: Pull complete
d982c879c57e: Pull complete
Digest: sha256:0954cc1af252d824860b2c5dc0a10720af2b7a3d3435581ca788dff8480c7b32
Status: Downloaded newer image for httpd:latest
75eb0432b6df1db0ec9856fb6c6a953b233a2a8f5f01736d3c3cf41bdb45ad03
[root@localhost ~]# docker ps
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
75eb0432b6df httpd "httpd-foreground" 22 seconds ago Up 18 seconds 0.0.0.0:80->80/tcp, :::80->80/tcp web
[root@localhost ~]# ss -antl
State Recv-Q Send-Q Local Address:Port Peer Address:Port Process
LISTEN 0 128 0.0.0.0:80 0.0.0.0:*
LISTEN 0 128 0.0.0.0:22 0.0.0.0:*
LISTEN 0 128 [::]:80 [::]:*
LISTEN 0 128 [::]:22 [::]:*
用IP地址访问
在容器中使用数据卷
在容器内创建一个数据卷
下面使用nginx镜像创建一个web容器,并创建一个数据卷挂载到容器的/webapp目录下:
[root@localhost ~]# docker run -dit --name yy -P -v /web httpd
ca4984ad22c0596dfc95808f78449b9d294a59b30b60fe1d094f2ffc789ef2bd
[root@localhost ~]# docker ps
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
ca4984ad22c0 httpd "httpd-foreground" 10 seconds ago Up 6 seconds 0.0.0.0:49153->80/tcp, :::49153->80/tcp yy
这里的-P是允许外部访问容器需要暴露的端口。
挂载一个主机目录作为数据卷
[root@localhost ~]# docker run -dit --name yy1 -P -v /var/www/html:/web httpd
7defc9ff6bfc56b8d30cdeac0178f0d5de827912a534bd726fab81e9db5661af
[root@localhost ~]# docker ps
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
7defc9ff6bfc httpd "httpd-foreground" 6 seconds ago Up 4 seconds 0.0.0.0:49154->80/tcp, :::49154->80/tcp yy1
上面的命令加载主机的/var/www/html目录到容器的/webapp目录:
这个功能在进行测试的时候非常方便,比如用户可以放置一些程序或数据到本地目录中,然后在容器内运行和使用。另外,本地目录的路径必须是绝对路径,如果目录不存在,Docker会自动创建。
[root@localhost ~]# cd /var/www/html/
[root@localhost html]# ls
[root@localhost html]# mkdir a b c
[root@localhost html]# ls
a b c
[root@localhost ~]# docker exec -it yy1 /bin/bash
root@7defc9ff6bfc:/usr/local/apache2# cd /web/
root@7defc9ff6bfc:/web# ls
a b c
Docker挂载数据卷的默认权限是读写(rw),用户也可以通过(ro)指定为只读:
[root@localhost ~]# docker run -dit --name web2 -v /opt/web2:/usr/local/apache2/htdocs httpd
9c05c064d27794f3a8d0f052f04065b798d4eb06d7912f6abb49d08104ef82ef
[root@localhost ~]# docker ps
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
9c05c064d277 httpd "httpd-foreground" 8 seconds ago Up 5 seconds 80/tcp web2
[root@localhost ~]# echo "hello" > /opt/web2/index.html
[root@localhost ~]# docker inspect web2
......
"Gateway": "172.17.0.1",
"GlobalIPv6Address": "",
"GlobalIPv6PrefixLen": 0,
"IPAddress": "172.17.0.5",
[root@localhost ~]# curl 172.17.0.5
hello
[root@localhost ~]# docker exec -it web2 /bin/bash
root@9c05c064d277:/usr/local/apache2# ls
bin build cgi-bin conf error htdocs icons include logs modules
root@9c05c064d277:/usr/local/apache2# cd htdocs/
root@9c05c064d277:/usr/local/apache2/htdocs# ls
index.html
root@9c05c064d277:/usr/local/apache2/htdocs# cat index.html
hello
root@9c05c064d277:/usr/local/apache2/htdocs# rm -f index.html
root@9c05c064d277:/usr/local/apache2/htdocs# ls
root@9c05c064d277:/usr/local/apache2/htdocs#
[root@localhost ~]# cd /opt/web2/
[root@localhost web2]# ls
[root@localhost web2]#
[root@localhost ~]# docker run -dit --name web1 -v /opt/web1:/usr/local/apache2/htdocs:ro httpd
2d690aab007d42d4d0649e93739905c9f54bf6f44e16c0d1d2ae41b903339622
[root@localhost ~]# docker ps
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
2d690aab007d httpd "httpd-foreground" 8 seconds ago Up 6 seconds 80/tcp web1
[root@localhost ~]# echo "hi" > /opt/web1/index.html
[root@localhost ~]# docker inspect web1
......
"Gateway": "172.17.0.1",
"IPAddress": "172.17.0.6",
[root@localhost ~]# curl 172.17.0.6
hi
[root@localhost ~]# docker exec -it web1 /bin/bash
root@2d690aab007d:/usr/local/apache2# ls
bin build cgi-bin conf error htdocs icons include logs modules
root@2d690aab007d:/usr/local/apache2# cd htdocs/
root@2d690aab007d:/usr/local/apache2/htdocs# ls
index.html
root@2d690aab007d:/usr/local/apache2/htdocs# cat index.html
hi
root@2d690aab007d:/usr/local/apache2/htdocs# rm -f index.html
rm: cannot remove 'index.html': Read-only file system
[root@localhost ~]# cd /opt/web1/
[root@localhost web1]# ls
index.html
[root@localhost web1]# rm -f index.html
[root@localhost web1]# ls
加了:ro以后,容器内挂载的数据卷的数据就无法修改了。
挂载一个本地主机文件作为数据卷
-v选项也可以从主机挂载单个文件到容器中作为数据卷:
[root@localhost ~]# touch a.txt
[root@localhost ~]# docker run -dit --name web3 -v /root/a.txt:/a.txt centos
872181bdc300987d33f8bae8e87407ff7fd3594ecf77b71dde7cbdc03ee74e7e
[root@localhost ~]# ls
anaconda-ks.cfg a.txt
[root@localhost ~]# docker exec -it web3 /bin/bash
[root@872181bdc300 /]# cat a.txt
[root@872181bdc300 /]# cat a.txt
123456
如果直接挂载一个文件到容器,使用文件编辑工具,包括vi或者sed去修改文件内容的时候,可能会造成inode的改变,这样将会导致错误。所以推荐的方式是直接挂载文件所在的目录。
数据卷容器
如果用户需要在容器之间共享一些持续更新的数据,最简单的方式是使用数据卷容器。数据卷容器其实就是一个普通的容器,专门用它提供数据卷供其他容器挂载使用,方法如下:
首先,创建一个数据卷容器dbdata,并在其中创建一个数据卷挂载到/dbdata:
[root@localhost ~]# docker run -dit --name dbdata -v /dbdata centos
5922d38ae75043ad6afbd30fedb34e23ebc78a4fe4e563ec4fe7132398b42e42
[root@localhost ~]# docker ps
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
5922d38ae750 centos "/bin/bash" 6 seconds ago Up 4 seconds dbdata
然后可以在其他容器中使用–volumes-from来挂载dbdata容器中的数据卷,例如创建db1和db2两个容器,并从dbdata容器挂载数据卷:
[root@localhost ~]# docker run -dit --name db1 --volumes-from dbdata centos
b4c9a42231ebd607be78cf948238c38907d6e1c92e2c5512edda76b8bb51902e
[root@localhost ~]# docker run -dit --name db2 --volumes-from dbdata centos
965cee378776469f632a8f1f7d439fb122dd04ad06c7a0d3376b3a6a6c442ed6
[root@localhost ~]# docker ps
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
965cee378776 centos "/bin/bash" 8 seconds ago Up 6 seconds db2
b4c9a42231eb centos "/bin/bash" 25 seconds ago Up 23 seconds db1
此时,容器db1和db2都挂载同一个数据卷到相同的/dbdata目录。三个容器任何一方在该目录下的写入,其他容器都可以看到。
[root@localhost ~]# docker exec -it db1 /bin/bash
[root@b4c9a42231eb /]# ls
bin dev home lib64 media opt root sbin sys usr
dbdata etc lib lost+found mnt proc run srv tmp var
[root@localhost ~]# docker exec -it db2 /bin/bash
[root@965cee378776 /]# ls
bin dev home lib64 media opt root sbin sys usr
dbdata etc lib lost+found mnt proc run srv tmp var
[root@localhost ~]# docker inspect dbdata
......
"Mounts": [
{
"Type": "volume",
"Name": "e919dcbd14d6adc97ea7d8c5ad2d8ce4b3989a1d463deb72cff895592ceafc32",
"Source": "/var/lib/docker/volumes/e919dcbd14d6adc97ea7d8c5ad2d8ce4b3989a1d463deb72cff895592ceafc32/_data",
"Destination": "/dbdata",
"Driver": "local",
[root@localhost ~]# cd /var/lib/docker/volumes/e919dcbd14d6adc97ea7d8c5ad2d8ce4b3989a1d463deb72cff895592ceafc32/_data
[root@localhost _data]# ls
[root@localhost _data]# touch 1 2 3
[root@localhost _data]# ls
1 2 3
[root@b4c9a42231eb /]# cd dbdata
[root@b4c9a42231eb dbdata]# ls
1 2 3
[root@965cee378776 /]# cd dbdata/
[root@965cee378776 dbdata]# ls
1 2 3
[root@965cee378776 dbdata]# rm -f 3
[root@965cee378776 dbdata]# ls
1 2
[root@localhost _data]# ls
1 2
可以多次使用–volumes-from参数来从多个容器挂载多个数据卷。还可以从其他已挂载了容器卷的容器来挂载数据卷:
[root@localhost ~]# docker run -dit --name db3 --volumes-from db1 centos
c7b8717e071d5da966963569de8733206faf2aed4086ac89e47948929c69f117
使用–volumes-from参数所挂载数据卷的容器自身并不需要保持在运行状态。
如果删除了挂载的容器(包括dbdata、db1和db2),数据卷并不会被自动删除。如果要删除一个数据卷,必须在删除最后一个还挂载着它的容器时显式使用docker rm -v命令来指定同时删除关联的容器。
[root@localhost ~]# docker ps
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
c7b8717e071d centos "/bin/bash" 34 seconds ago Up 31 seconds db3
965cee378776 centos "/bin/bash" 14 minutes ago Up 14 minutes db2
b4c9a42231eb centos "/bin/bash" 14 minutes ago Up 14 minutes db1
5922d38ae750 centos "/bin/bash" 15 minutes ago Up 15 minutes dbdata
872181bdc300 centos "/bin/bash" 26 minutes ago Up 26 minutes web3
[root@localhost ~]# docker rm -f dbdata
dbdata
[root@localhost ~]# docker rm -f db1
db1
[root@localhost ~]# docker rm -f db2
db2
[root@localhost ~]# docker rm -fv db3
db3
[root@localhost _data]# cd /var/lib/docker/volumes/e919dcbd14d6adc97ea7d8c5ad2d8ce4b3989a1d463deb72cff895592ceafc32/_data
-bash: cd: /var/lib/docker/volumes/e919dcbd14d6adc97ea7d8c5ad2d8ce4b3989a1d463deb72cff895592ceafc32/_data: No such file or directory
利用数据卷容器迁移数据
可以利用数据卷容器对其中的数据卷进行备份、恢复,以实现数据的迁移。
备份
使用下面的命令来备份dbdata数据卷容器内的数据卷:
[root@localhost ~]# docker run -dit --name dbdata -v /dbdata centos
4c95541c332783bfa7300aa20b881e6d3f1c5987e345540102644a3faceba91c
[root@localhost ~]# docker inspect dbdata
......
"Mounts": [
{
"Type": "volume",
"Name": "e0e28c80a23d7dc8cdd908b1c180600f9772c0bb9c9c8907d19b8da9032dd990",
"Source": "/var/lib/docker/volumes/e0e28c80a23d7dc8cdd908b1c180600f9772c0bb9c9c8907d19b8da9032dd990/_data",
"Destination": "/dbdata",
[root@localhost ~]# cd /var/lib/docker/volumes/e0e28c80a23d7dc8cdd908b1c180600f9772c0bb9c9c8907d19b8da9032dd990/_data
[root@localhost _data]# ls
[root@localhost _data]# touch a b c
[root@localhost _data]# ls
a b c
[root@localhost ~]# docker cp dbdata:/dbdata ~/dbdata
[root@localhost ~]# ls
anaconda-ks.cfg a.txt dbdata
[root@localhost ~]# cd dbdata/
[root@localhost dbdata]# ls
a b c
或
[root@localhost ~]# docker run -dit --name db1 -v $(pwd):/backup --volumes-from dbdata centos tar cvf /backup/backup.tar /dbdata
ab8c49dc35db248bcf9dba088b7ae8d10775d385df5c3ad01413c04b3de3a197
[root@localhost ~]# ls
anaconda-ks.cfg a.txt backup.tar dbdata
这个命令稍微有点复杂,具体分析下。
首先利用centos镜像创建了一个容器worker。使用–volumes-from dbdata参数来让worker容器挂载dbdata容器的数据卷(即dbdata数据卷);使用-v $(pwd):/backup参数来挂载本地的当前目录到worker容器的/backup目录。
worker容器启动后,使用了tar cvf /backup/backup.tar /dbdata命令来将/dbdata下内容备份为容器内的/backup/backup.tar,即宿主主机当前目录下的backup.tar。
恢复
如果要恢复数据到一个容器,可以按照下面的操作。首先创建一个带有数据卷的容器db2:
[root@localhost ~]# docker run -dit --name db2 -v /dbdata centos
e3f1194ce1335fc476b4793d390fb3cd1217e23f6d3ad2bc06ef11066ead1417
[root@localhost ~]# docker ps
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
e3f1194ce133 centos "/bin/bash" 8 seconds ago Up 6 seconds db2
然后创建另一个新的容器,挂载db2容器,并使用untar解压备份文件到所挂载的容器卷中即可:
[root@localhost ~]# docker run -dit --name db3 --volumes-from db2 -v $(pwd):/backup centos tar xf /backup/backup.tar
762810ab81b82102a99a3ba26ba39086a166a67ca2afcdd8f97b093226619ef1
[root@localhost ~]# docker ps
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
e3f1194ce133 centos "/bin/bash" 2 minutes ago Up About a minute db2
[root@localhost ~]# docker exec -it db2 /bin/bash
[root@e3f1194ce133 /]# ls
bin dev home lib64 media opt root sbin sys usr
dbdata etc lib lost+found mnt proc run srv tmp var
[root@e3f1194ce133 /]# cd dbdata/
[root@e3f1194ce133 dbdata]# ls
a b c