docker存储卷
cow机制
Docker镜像由多个只读层叠加而成,启动容器时,Docker会加载只读镜像层并在镜像栈顶部添加一个读写层。
如果运行中的容器修改了现有的一个已经存在的文件,那么该文件将会从读写层下面的只读层复制到读写层,该文件的只读版本依然存在,只是已经被读写层中该文件的副本所隐藏,这就是“写时复制(COW)”机制
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-fiB9N35m-1660135584897)(./1.jpg)]
对于这种方式来说,我们去访问一个文件,修改和删除等一类的操作,其效率会非常的低,因为隔着很多层镜像。
而要想绕过这种限制,我们可以通过使用存储卷的机制来
什么是存储卷
存储卷就是将宿主机的本地文件系统中存在的某个目录直接与容器内部的文件系统上的某一目录建立绑定关系。这就意味着,当我们在容器中的这个目录下写入数据时,容器会将其内容直接写入到宿主机上与此容器建立了绑定关系的目录
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-uNhh0LgV-1660135584899)(./2.jpg)]
在宿主机上的这个与容器形成绑定关系的目录被称作存储卷。
使用存储卷的好处
如果容器中跑的进程的所有有效数据都保存在存储卷中,从而脱离容器自身文件系统之后,带来的好处是当容器关闭甚至被删除时,只要不删除与此容器绑定的在宿主机上的这个存储目录,我们就不用担心数据丢失了。因此就可以实现数据持久,脱离容器的生命周期而持久。
我们通过这种方式管理容器,容器就可以脱离主机的限制,可以在任意一台部署了docker的主机上跑容器,而其数据则可以置于一个共享存储文件系统上,比如nfs。
Docker的存储卷默认情况下是使用其所在的宿主机上的本地文件系统目录的,也就是说宿主机上有一块属于自己的硬盘,这个硬盘并没有共享给其他的Docker主机,而在这台主机上启动的容器所使用的存储卷是关联到此宿主机硬盘上的某个目录之上。
这就意味着容器在这台主机上停止运行或者被删除了再重建,只要关联到硬盘上的这个目录下,那么其数据还存在。但如果在另一台主机上启动一个新容器,那么数据就没了。而如果在创建容器的时候我们手动的将容器的数据挂载到一台nfs服务器上,那么这个问题就不再是问题了。
为什么要用存储卷
关闭并重启容器,其数据不受影响,但删除Docker容器,则其更改将会全部丢失。
因此Docker存在的问题有:
存储于联合挂载文件系统中,不易于宿主机访问
容器间数据共享不便
删除容器其数据会丢失
而要解决这些问题,解决方案就是使用存储卷
存储卷管理方式
存储卷(Data Volume)于容器初始化时被自动创建,由base image提供的卷中的数据会于此期间完成复制。
Volume的初衷是独立于容器的生命周期实现数据持久化,因此删除容器之时既不会删除卷,也不会对未被引用的卷做垃圾回收操作。
存储卷为Docker提供了独立于容器的数据管理机制,我们可以把镜像想象成静态文件,例如“程序”,把卷类比为动态内容,例如“数据”。所以镜像可以重用,而卷则可以共享。
卷实现了“程序(镜像)”和“数据(卷)”的分离,以及“程序(镜像)”和“制作镜像的主机”的分离,用户制作镜像时无须再考虑镜像运行的容器所在的主机的环境!
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Jlo3lEFY-1660135584900)(./3.jpg)]
存储卷的分类
Docker有两种类型的卷,每种类型都在容器中存在一个挂载点,但其在宿主机上的位置有所不同:
绑定挂载卷
指向主机文件系统上用户指定位置的卷
Docker 管理的卷
Docker 守护进程在 Docker 拥有的主机文件系统的一部分中创建托管卷
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-tJy1B8GR-1660135584902)(./4.jpg)]
容器数据管理
容器中管理数据主要有两种方式:
数据卷(Data Volumes)
数据卷容器(Data Volumes Containers)
容器Volume使用语法
Docker-managed volume
docker run -it --name CONTAINER_NAME -v VOLUMEDIR IMAGE_NAME
[root@localhost ~]# docker run -dit --name b1 -v /data busybox
79je2sw287c18ff9269235c3cb9219a5cfee4a9a8a532a37a5ad22bf5f9160fd
[root@localhost ~]# docker exec -it b1 /bin/sh
/ # ls
bin data dev etc home proc root sys tmp usr var
/ # cd data
/data # echo 'haihaihai' > a.txt
/data # cat a.txt
haihaihai
[root@localhost ~]# docker inspect b1
"Mounts": [
{
"Type": "volume",
"Name": "648g9usj8607a4e2d33cafce7a58f89fa8a9438f4aaece0cacc2643c7bd2c6c4",
"Source": "/var/lib/docker/volumes/648g9usj8607a4e2d33cafce7a58f89fa8a9438f4aaece0cacc2643c7bd2c6c4/_data", // 找到文件存放位置
"Destination": "/data",
"Driver": "local",
"Mode": "",
"RW": true,
"Propagation": ""
}
[root@localhost ~]# cd /var/lib/docker/volumes/648g9usj8607a4e2d33cafce7a58f89fa8a9438f4aaece0cacc2643c7bd2c6c4/_data
[root@localhost _data]# ls
a.txt
[root@localhost _data]# cat a.txt
haihaihai
docker run -it --name CONTAINER_NAME -v HOSTDIR:VOLUMEDIR IMAGE_NAME
加载宿主机的/opt/dtat目录到容器的/data目录
[root@localhost ~]# docker run -dit --name b2 -v /opt/dtat:/data busybox
147bh987qe6e9afd117a799ade885a0b5b68b3e0d3a11d90621adaf025bd1ff1
[root@localhost ~]# docker ps
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
5js24b22396e busybox "sh" 6 seconds ago Up 5 seconds b2
98d1332f86c1 busybox "sh" 25 minutes ago Up 25 minutes b1
n973hce9d25b httpd "httpd-foreground" 16 hours ago Up 45 minutes 80/tcp web
进入b2容器里面的/data目录下创建一个文件一个目录
[root@localhost ~]# docker exec -it b2 /bin/sh
/ # cd data
/data # touch a
/data # mkdir b
/data # ls
a b c
另起一个终端在宿主机上查看刚刚在b2容器里面创建的文件和目录,并在宿主机的/opt/dtat目录下也创建文件
[root@localhost dtat]# ls
a b c
[root@localhost dtat]# touch d
[root@localhost dtat]# ls
a b c d
返回b2容器查看
/data # ls
a b c d
在容器中使用数据卷
创建一个数据卷
[root@localhost ~]# docker run -dit -P --name v2 -v /data httpd
j78d3u79j01cde9d4abf8118abdd92a18c7383670c1515f268b546b52f8e4bcf
[root@localhost ~]# docker ps
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
j875fdd4de1c httpd "httpd-foreground" 3 seconds ago Up 1 second 0.0.0.0:49153->80/tcp, :::49153->80/tcp v2
j864ec991c83 busybox "sh" 55 seconds ago Up 53 seconds v1
h753e32f86c1 busybox "sh" 56 minutes ago Up 56 minutes b1
jnh36ce9d25b httpd "httpd-foreground" 16 hours ago Up About an hour 80/tcp web
[root@localhost ~]# ss -antl
State Recv-Q Send-Q Local Address:Port Peer Address:Port Process
LISTEN 0 128 0.0.0.0:49153 0.0.0.0:*
LISTEN 0 128 0.0.0.0:22 0.0.0.0:*
LISTEN 0 128 [::]:49153 [::]:*
LISTEN 0 128 *:2375 *:*
挂载一个主机目录作为数据卷
[root@localhost ~]# docker run -dit --name tnt -P -v /opt/tnt:/tnt httpd
9cfe36bad18e66f402b95668b8b836f963de37780a863ac2f38e363798b29177
[root@localhost ~]# docker ps
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
9cfe36bad18e httpd "httpd-foreground" 8 seconds ago Up 4 seconds 0.0.0.0:49154->80/tcp, :::49154->80/tcp tnt
docker挂载数据卷默认权限是读写
[root@localhost ~]# docker run -dit --name web1 -v /opt/web1:/usr/local/apache2/htdocs:ro httpd
[root@localhost ~]# cd /opt/web1
[root@localhost web1]# echo 'TNT' > index.html
[root@localhost web1]# cat index.html
TNT
[root@localhost web1]# docker exec -it web1 /bin/bash
root@2785fe2e7b85:/usr/local/apache2# cd htdocs
root@2785fe2e7b85:/usr/local/apache2/htdocs# ls
index.html
root@2785fe2e7b85:/usr/local/apache2/htdocs# cat index.html
TNT
root@2785fe2e7b85:/usr/local/apache2/htdocs# rm -rf index.html
rm:cannot remove 'index.html': read-only file system
没有权限删除不了
挂载一个本地主机文件为数据卷
[root@localhost ~]# docker run -dit --name zhang -v ~/.nash_history:/.bash_history httpd
81b19ed92755f7ca1dccd578355bdd0a91df9fe843c22ffbc4e88ab26a6d91e0
# docker ps
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
81b19ed92755 httpd "httpd-foreground" 11 seconds ago Up 6 seconds 80/tcp zhang
[root@localhost ~]# cd /opt/zhang
[root@localhost zhang]# history
40 cd /opt/zhang
41 history
如果直接挂载一个文件到容器,使用文件编辑工具,包括vi或者sed去修改文件内容的时候,可能会造成inode的改变,这样将会导致错误。所以推荐的方式是直接挂载文件所在的目录。
数据卷容器
如果用户需要在容器之间共享一些持续更新的数据,最简单的方式是使用数据卷容器。数据卷容器其实就是一个普通的容器,专门用它提供数据卷供其他容器挂载使用
创建一个数据卷容器zzy,创建一个数据卷挂载到/zzy
[root@localhost ~]# docker run -it -d --name zzy -v /zzy centos
7b3f29316ef0f8d91d7f9b50367896b675d0582c986c494ff2a24a39a4fbfa30
然后可以在其他容器中使用–volumes-from来挂载zzy容器中的数据卷,例如创建db1和db2两个容器,并从zzy容器挂载数据卷
[root@localhost ~]# docker run -dit --name db1 --volumes-from zzy centos
sha256:a27fd8080b517143cbbbab9dfb7c8571c40d67d534bbdee55bd6c473f432b177
[root@localhost ~]# docker ps
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
50fb442b74b7 centos "/bin/bash" 13 seconds ago Up 11 seconds db2
7b3f29316ef0 centos "/bin/bash" About a minute ago Up About a minute db1
e367a9516b07 centos "/bin/bash" 3 minutes ago Up 2 minutes zzy
此时,容器db1和db2都挂载同一个数据卷到相同的/dbdata目录。三个容器任何一方在该目录下的写入,其他容器都可以看到
[root@localhost ~]# docker exec -it db1 /bin/bash
[root@7b3f29316ef0 /]# ls
bin etc lib lost+found mnt proc run srv tmp var
dev home lib64 media opt root sbin sys usr zzy
[root@7b3f29316ef0 /]# cd zzy
[root@7b3f29316ef0 zzy]# ls
[root@7b3f29316ef0 zzy]# touch test
[root@7b3f29316ef0 zzy]# ls
test
[root@localhost ~]# docker exec -it db2 /bin/bash
[root@50fb442b74b7 /]# ls
bin etc lib lost+found mnt proc run srv tmp var
dev home lib64 media opt root sbin sys usr zzy
[root@50fb442b74b7 /]# cd zzy
[root@50fb442b74b7 zzy]# ls
test
可以多次使用–volumes-from参数来从多个容器挂载多个数据卷。还可以从其他已挂载了容器卷的容器来挂载数据卷
[root@localhost ~]# docker run -dit --name db3 --volumes-from db1 centos
33a3934afc16ab878f84781fc701adb8763524d503a7058629c7f970a70a8c5e
[root@localhost ~]# docker ps
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
33a3934afc16 centos "/bin/bash" 13 seconds ago Up 4 seconds db3
[root@localhost ~]# docker exec -it db3 /bin/bash
[root@33a3934afc16 /]# ls --color
bin etc lib lost+found mnt proc run srv tmp var
dev home lib64 media opt root sbin sys usr zzy
[root@33a3934afc16 /]# cd zzy
[root@33a3934afc16 zzy]# ls
test
使用–volumes-from参数所挂载数据卷的容器自身并不需要保持在运行状态。
如果删除了挂载的容器(包括dbdata、db1和db2),数据卷并不会被自动删除。如果要删除一个数据卷,必须在删除最后一个还挂载着它的容器时显式使用docker rm -v命令来指定同时删除关联的容器
利用数据卷容器迁移数据
可以利用数据卷容器对其中的数据卷进行备份、恢复,以实现数据的迁移。
备份
使用下面的命令来备份zzy数据卷容器内的数据卷
[root@localhost ~]# docker run --name worker --volumes-from zzy -v $(pwd):/backup centos tar cvf /backup/backup.tar /zzy
tar: Removing leading `/' from member names
/zzy/
/zzy/test
/zzy/yhx/
[root@localhost ~]# docker ps -a
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
3810814f67ad centos "tar cvf /backup/bac…" 48 seconds ago Exited (0) 46 seconds ago worker
7d6f3031cab2 centos "cvf /backup/backup.…" About a minute ago Created yhx
33a3934afc16 centos "/bin/bash" 5 minutes ago Up 5 minutes db3
50fb442b74b7 centos "/bin/bash" 12 minutes ago Up 12 minutes db2
7b3f29316ef0 centos "/bin/bash" 13 minutes ago Up 13 minutes db1
e367a9516b07 centos "/bin/bash" 15 minutes ago Up 14 minutes zzy
[root@localhost ~]# ls
anaconda-ks.cfg backup.tar passwd
这个命令稍微有点复杂,具体分析下。
首先利用centos镜像创建了一个容器worker。使用–volumes-from dbdata参数来让worker容器挂载dbdata容器的数据卷(即dbdata数据卷);使用-v $(pwd):/backup参数来挂载本地的当前目录到worker容器的/backup目录。
worker容器启动后,使用了tar cvf /backup/backup.tar /dbdata命令来将/dbdata下内容备份为容器内的/backup/backup.tar,即宿主主机当前目录下的backup.tar。
恢复
如果要恢复数据到一个容器,可以按照下面的操作。首先创建一个带有数据卷的容器dcx
[root@localhost ~]# docker run -it --name dcx -v /zzy centos /bin/bash
[root@64002106ea90 /]#
创建另一个新的容器,挂载dcx容器,并使用untar解压备份文件到所挂载的容器卷中即可
[root@localhost ~]# docker run --name syx --volumes-form dcx -v $(pwd):/backup centos
[root@localhost ~]# docker ps -a
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
82n9dk29u2nd centos "/tar xf /backup/..." 5 minutes ago Exited (9) About a minut
4002106ea90 centos "/bin/bash" 2 minutes ago Exited (17) About a minute ago dcx
33a3934afc16 centos "/bin/bash" 13 minutes ago Up 12 minutes db3
50fb442b74b7 centos "/bin/bash" 19 minutes ago Up 19 minutes db2
7b3f29316ef0 centos "/bin/bash" 21 minutes ago Up 21 minutes db1
e367a9516b07 centos "/bin/bash" 22 minutes ago Up 22 minutes zzy
到dxc容器查看/zzy里面的内容
[root@localhost ~]# docker run -it --name dcx -v /zzy centos /bin/bash
[root@e367a9516b07 /]#
[root@e367a9516b07 /]# cd zzy
[root@e367a9516b07 zzy]# ls
yhx test