【docker存储卷】

本文深入介绍了Docker存储卷的概念、COW机制及其优势。通过存储卷,可以实现容器数据的持久化,即使容器销毁,数据也能保留。此外,详细讲解了如何创建和使用存储卷,包括绑定挂载和Docker管理的体积,以及数据卷容器的使用,用于在容器间共享和迁移数据。最后,展示了如何备份和恢复数据卷,确保数据的安全性。
摘要由CSDN通过智能技术生成

docker存储卷

COW机制

Docker镜像由多个只读层叠加而成,启动容器时,Docker会加载只读镜像层并在镜像栈顶部添加一个读写层。

如果运行中的容器修改了现有的一个已经存在的文件,那么该文件将会从读写层下面的只读层复制到读写层,该文件的只读版本依然存在,只是已经被读写层中该文件的副本所隐藏,这就是“写时复制(COW)”机制。

img

对于这种方式来说,我们去访问一个文件,修改和删除等一类的操作,其效率会非常的低,因为隔着很多层镜像。

而要想绕过这种限制,我们可以通过使用存储卷的机制来实现。

什么是存储卷

存储卷就是将宿主机的本地文件系统中存在的某个目录直接与容器内部的文件系统上的某一目录建立绑定关系。这就意味着,当我们在容器中的这个目录下写入数据时,容器会将其内容直接写入到宿主机上与此容器建立了绑定关系的目录。

img

在宿主机上的这个与容器形成绑定关系的目录被称作存储卷。

使用存储卷的好处

如果容器中跑的进程的所有有效数据都保存在存储卷中,从而脱离容器自身文件系统之后,带来的好处是当容器关闭甚至被删除时,只要不删除与此容器绑定的在宿主机上的这个存储目录,我们就不用担心数据丢失了。因此就可以实现数据持久,脱离容器的生命周期而持久。

我们通过这种方式管理容器,容器就可以脱离主机的限制,可以在任意一台部署了docker的主机上跑容器,而其数据则可以置于一个共享存储文件系统上,比如nfs。

Docker的存储卷默认情况下是使用其所在的宿主机上的本地文件系统目录的,也就是说宿主机上有一块属于自己的硬盘,这个硬盘并没有共享给其他的Docker主机,而在这台主机上启动的容器所使用的存储卷是关联到此宿主机硬盘上的某个目录之上。

这就意味着容器在这台主机上停止运行或者被删除了再重建,只要关联到硬盘上的这个目录下,那么其数据还存在。但如果在另一台主机上启动一个新容器,那么数据就没了。而如果在创建容器的时候我们手动的将容器的数据挂载到一台nfs服务器上,那么这个问题就不再是问题了。

为什么要用存储卷

关闭并重启容器,其数据不受影响,但删除Docker容器,则其更改将会全部丢失。

因此Docker存在的问题有:

  • 存储于联合挂载文件系统中,不易于宿主机访问
  • 容器间数据共享不便
  • 删除容器其数据会丢失

而要解决这些问题,解决方案就是使用存储卷。

存储卷管理方式

存储卷(Data Volume)于容器初始化时被自动创建,由base image提供的卷中的数据会于此期间完成复制。

Volume的初衷是独立于容器的生命周期实现数据持久化,因此删除容器之时既不会删除卷,也不会对未被引用的卷做垃圾回收操作。

存储卷为Docker提供了独立于容器的数据管理机制,我们可以把镜像想象成静态文件,例如“程序”,把卷类比为动态内容,例如“数据”。所以镜像可以重用,而卷则可以共享。

卷实现了“程序(镜像)”和“数据(卷)”的分离,以及“程序(镜像)”和“制作镜像的主机”的分离,用户制作镜像时无须再考虑镜像运行的容器所在的主机的环境。

img

存储卷的分类

Docker有两种类型的卷,每种类型都在容器中存在一个挂载点,但其在宿主机上的位置有所不同:

  • Bind mount volume(绑定挂载卷)

    • a volume that points to a user-specified location on the host file system

      (指向主机文件系统上用户指定位置的卷)

  • Docker-managed volume (Docker-managed体积)

    • the Docker daemon creates managed volumes in a portion of the host’s file system that’s owned bye Docker

      (Docker守护进程在bye Docker拥有的主机文件系统的一部分中创建托管卷)

img

容器数据管理

用户在使用Docker的过程中,往往需要能查看容器内应用产生的数据,或者需要把容器内的数据进行备份,甚至多个容器之间进行数据的共享,这必然涉及容器的数据管理操作。

容器中管理数据主要有两种方式:

  • 数据卷(Data Volumes)
  • 数据卷容器(Data Volumes Containers)

容器Volume使用语法:
Docker-managed volume

docker run -it --name CONTAINER_NAME -v VOLUMEDIR IMAGE_NAME
[root@lch ~]# docker run -it --name b1 --rm -v /data busybox  //运行有一个容器
/ # ls
bin   data  dev   etc   home  proc  root  sys   tmp   usr   var
/ # ls /data/
//找到真机文件的位置
[root@lch ~]# docker inspect b1
 "Mounts": [
            {
                "Type": "volume",
                "Name": "5f0f1d81faf16fefb85c97bc305aea3bc17069b2dc61e7fa5d1db55b4c008dfb",
                "Source": "/var/lib/docker/volumes/5f0f1d81faf16fefb85c97bc305aea3bc17069b2dc61e7fa5d1db55b4c008dfb/_data",  //这个就是
                "Destination": "/data",
                "Driver": "local",
                "Mode": "",
                "RW": true,
                "Propagation": ""
            }
//进入目录创建一个文件
[root@lch ~]# cd /var/lib/docker/volumes/5f0f1d81faf16fefb85c97bc305aea3bc17069b2dc61e7fa5d1db55b4c008dfb/_data
[root@lch _data]# ls
[root@lch _data]# touch abc
[root@lch _data]# ls
abc
//可以看到容器也有这个文件
/ # cd /data/
/data # ls
abc
/data # rm /data/abc   //在容器里删除这个文件
/data # ls
/data # 
[root@lch _data]# ls   //真机里面也会删除
[root@lch _data]# 

Bind mount volume

docker run -it --name CONTAINER_NAME -v HOSTDIR:VOLUMEDIR IMAGE_NAME
//运行一个容器
[root@lch ~]# docker run -it --name b1 --rm -v /usr/src:/data busybox
/ # ls
bin   data  dev   etc   home  proc  root  sys   tmp   usr   var
/ # cd /data/
/data # touch adc  //创建一个文件
/data # ls
adc      debug    kernels
/data # 
[root@lch ~]# cd /usr/src/
[root@lch src]# ls  //这里可以看到跟容器绑定的这个目录下也有这个文件
adc  debug  kernels
/data # exit   
[root@lch ~]# 
[root@lch src]# docker ps -a
CONTAINER ID   IMAGE     COMMAND   CREATED   STATUS    PORTS     NAMES
[root@lch src]# ls  //容器删除了 这个文件也是存在的
adc  debug  kernels

在容器中使用数据卷

在容器内创建一个数据卷

下面使用nginx镜像创建一个web容器,并创建一个数据卷挂载到容器的/webapp目录下:

[root@localhost ~]# docker run -d -P --name web -v /webapp nginx

这里的-P是允许外部访问容器需要暴露的端口。

挂载一个主机目录作为数据卷

[root@lch data]# docker run -dit --name b2 -v /usr/src/data:/data busybox
2d7c495d6602341404784364bb855950ef9db7493e9dc809c4dc19de2c974611
[root@lch data]# docker ps
CONTAINER ID   IMAGE     COMMAND   CREATED         STATUS         PORTS     NAMES
2d7c495d6602   busybox   "sh"      5 seconds ago   Up 5 seconds             b2
23db6b941ae6   busybox   "sh"      8 minutes ago   Up 8 minutes             b1
[root@lch ~]# cd /usr/src/
[root@lch src]# ls
data  debug  kernels
[root@lch src]# cd data/
[root@lch data]# ls
[root@lch data]# touch abc 
[root@lch data]# ls
abc
[root@lch data]# docker exec -it b2 /bin/sh
/ # ls
bin   data  dev   etc   home  proc  root  sys   tmp   usr   var
/ # cd /usr/src
/ # cd /data/
/data # ls
abc
/data # rm -f abc
/data # ls
/data # 
[root@lch ~]# cd /usr/src/data/
[root@lch data]# ls
[root@lch data]# 

上面的命令加载主机的/var/www/html目录到容器的/webapp目录:
这个功能在进行测试的时候非常方便,比如用户可以放置一些程序或数据到本地目录中,然后在容器内运行和使用。另外,本地目录的路径必须是绝对路径,如果目录不存在,Docker会自动创建。

Docker挂载数据卷的默认权限是读写(rw),用户也可以通过(ro)指定为只读:

[root@lch data]# docker run -dit --name b2 -v /usr/src/data:/data:ro busybox
fa4aa7b37766802f7111320a29460bbdfc5b25a045398ec6d21cb8589166029a
[root@lch data]# docker exec -it b2 /bin/sh
/ # ls 
bin   data  dev   etc   home  proc  root  sys   tmp   usr   var
[root@lch data]# touch abc
[root@lch data]# ls
abc
/ # cd /data/
/data # ls
abc
/data # rm -f abc
rm: can't remove 'abc': Read-only file system  //只有可读的权限
/data # 

加了:ro以后,容器内挂载的数据卷的数据就无法修改了。

部署一个网站利用存储卷提供网站内容

[root@lch etc]# cd /web/
[root@lch web]# ls
[root@lch web]# mv ~/9-404.zip .
[root@lch web]# ls
9-404.zip
[root@lch web]# yum -y install unzip
[root@lch web]# unzip 9-404.zip
[root@lch web]# ls
9-404  9-404.zip
[root@lch web]# mv 9-404/* .
[root@lch web]# ls
9-404  9-404.zip  index.html  js  服务器之家.url  精品免费商业源码下载.url
[root@lch web]# rm -rf 9-404 9-404.zip 
[root@lch web]# ls
index.html  js  服务器之家.url  精品免费商业源码下载.url
[root@lch ~]# ss -antl
State      Recv-Q     Send-Q         Local Address:Port          Peer Address:Port     Process     
LISTEN     0          128                  0.0.0.0:80                 0.0.0.0:*                    
LISTEN     0          128                  0.0.0.0:22                 0.0.0.0:*                    
LISTEN     0          128                     [::]:80                    [::]:*                    
LISTEN     0          128                     [::]:22                    [::]:*                    
[root@lch ~]# 

在这里插入图片描述

挂载一个本地主机文件作为数据卷
-v选项也可以从主机挂载单个文件到容器中作为数据卷:

[root@lch ~]# docker run -it --rm -v ~/.bash_history:/.bash_history centos
[root@82f5cae7e208 /]# history
    1  history
[root@82f5cae7e208 /]# 
[root@82f5cae7e208 /]# wc -l .bash_history   //结果与本机查看一致
2 .bash_history

这样就可以记录在容器输入过的命令历史了。

如果直接挂载一个文件到容器,使用文件编辑工具,包括vi或者sed去修改文件内容的时候,可能会造成inode的改变,这样将会导致错误。所以推荐的方式是直接挂载文件所在的目录。

数据卷容器

如果用户需要在容器之间共享一些持续更新的数据,最简单的方式是使用数据卷容器。数据卷容器其实就是一个普通的容器,专门用它提供数据卷供其他容器挂载使用,方法如下:

首先,创建一个数据卷容器dbdata,并在其中创建一个数据卷挂载到/dbdata:

[root@lch ~]# docker run -dit --name dbdata -v /dbdata centos
b73fb9812774e2bdb813a7c6d3566b5f0281f3507a522bb7ff2257dc301dc2a5
[root@lch ~]# docker ps
CONTAINER ID   IMAGE     COMMAND       CREATED         STATUS         PORTS     NAMES
b73fb9812774   centos    "/bin/bash"   5 seconds ago   Up 4 seconds             dbdata

然后可以在其他容器中使用–volumes-from来挂载dbdata容器中的数据卷,例如创建db1和db2两个容器,并从dbdata容器挂载数据卷:

[root@lch ~]# docker run -dit --name db2 --volumes-from dbdata centos
678b5e32ab2a79a8f2aea6b9893f7eeb3cde3e11680ddcbfe24982b3ba5f7f2c
^[[A[root@lch ~]# docrun -dit --name db1 --volumes-from dbdata centos
aa3fab39d42a392577d9f02f646e67db01797a6766868cd6ae9ad9dee153b215
[root@lch ~]# docker ps
CONTAINER ID   IMAGE     COMMAND       CREATED              STATUS              PORTS     NAMES
aa3fab39d42a   centos    "/bin/bash"   3 seconds ago        Up 2 seconds                  db1
678b5e32ab2a   centos    "/bin/bash"   9 seconds ago        Up 8 seconds                  db2
b73fb9812774   centos    "/bin/bash"   About a minute ago   Up About a minute             dbd

此时,容器db1和db2都挂载同一个数据卷到相同的/dbdata目录。三个容器任何一方在该目录下的写入,其他容器都可以看到。
例如,在db2中创建一个abc文件:

[root@lch ~]# docker exec -it db1 /bin/bash
[root@aa3fab39d42a /]# ls
bin     dev  home  lib64       media  opt   root  sbin  sys  usr
dbdata  etc  lib   lost+found  mnt    proc  run   srv   tmp  var
[root@aa3fab39d42a /]# cd dbdata/
[root@aa3fab39d42a dbdata]# ls
[root@aa3fab39d42a dbdata]# 
[root@lch ~]# docker exec -it db2 /bin/bash
[root@678b5e32ab2a /]# ls
bin     dev  home  lib64       media  opt   root  sbin  sys  usr
dbdata  etc  lib   lost+found  mnt    proc  run   srv   tmp  var
[root@678b5e32ab2a /]# cd dbdata/
[root@678b5e32ab2a dbdata]# ls
[root@678b5e32ab2a dbdata]# touch abc  //在db2中创建一个文件
[root@678b5e32ab2a dbdata]# ls
abc
[root@aa3fab39d42a dbdata]# ls   //db1也可以看到
abc
[root@lch ~]# docker exec -it dbdata /bin/bash 
[root@b73fb9812774 /]# ls
bin     dev  home  lib64       media  opt   root  sbin  sys  usr
dbdata  etc  lib   lost+found  mnt    proc  run   srv   tmp  var
[root@b73fb9812774 /]# cd dbdata/
[root@b73fb9812774 dbdata]# ls   //dbdata也可以看到
abc

可以多次使用–volumes-from参数来从多个容器挂载多个数据卷。还可以从其他已挂载了容器卷的容器来挂载数据卷:

[root@lch ~]# docker run -dit --name db3 --volumes-from db1 centos
84d25b8e0b61247a66aa25fdab9bd5cad6e653ce82d848f9fa2f798401f3d6b3
[root@lch ~]# docker exec -it db3 /bin/bash
[root@84d25b8e0b61 /]# ls
bin     dev  home  lib64       media  opt   root  sbin  sys  usr
dbdata  etc  lib   lost+found  mnt    proc  run   srv   tmp  var
[root@84d25b8e0b61 /]# cd dbdata/
[root@84d25b8e0b61 dbdata]# ls   
abc

使用–volumes-from参数所挂载数据卷的容器自身并不需要保持在运行状态。

如果删除了挂载的容器(包括dbdata、db1和db2),数据卷并不会被自动删除。如果要删除一个数据卷,必须在删除最后一个还挂载着它的容器时显式使用docker rm -v命令来指定同时删除关联的容器。

[root@lch ~]# docker rm -f dbdata db1 db2
dbdata
db1
db2
[root@lch ~]# docker ps 
CONTAINER ID   IMAGE     COMMAND       CREATED              STATUS              PORTS     NAMES
84d25b8e0b61   centos    "/bin/bash"   About a minute ago   Up About a minute             db3
[root@lch ~]# docker rm -f -v db3
db3
[root@lch ~]# docker ps
CONTAINER ID   IMAGE     COMMAND   CREATED   STATUS    PORTS     NAMES

利用数据卷容器迁移数据

可以利用数据卷容器对其中的数据卷进行备份、恢复,以实现数据的迁移。

备份
使用下面的命令来备份dbdata数据卷容器内的数据卷:

[root@lch ~]# docker exec -it dbdata /bin/bash
[root@5c847d89003a /]# ls
bin     dev  home  lib64       media  opt   root  sbin  sys  usr
dbdata  etc  lib   lost+found  mnt    proc  run   srv   tmp  var
[root@5c847d89003a /]# cd dbdata/
[root@5c847d89003a dbdata]# ls
[root@5c847d89003a dbdata]# touch abc
[root@5c847d89003a dbdata]# ls
abc
[root@5c847d89003a dbdata]# echo 'hello' > abc
[root@5c847d89003a dbdata]# cat abc 
hello
[root@lch ~]# docker run -it --rm --volumes-from dbdata -v $(pwd):/backup centos tar -Jcf /backup/backup.tar.xz /dbdata
tar: Removing leading `/' from member names
[root@lch ~]# ls
anaconda-ks.cfg  backup.tar.xz
[root@lch ~]# tar backup.tar.xz 
tar: Old option 'b' requires an argument.
Try 'tar --help' or 'tar --usage' for more information.
[root@lch ~]# tar xf backup.tar.xz 
[root@lch ~]# ls
anaconda-ks.cfg  backup.tar.xz  dbdata
[root@lch ~]# cd dbdata/
[root@lch dbdata]# ls
abc
[root@lch dbdata]# cat abc 
hello

这个命令稍微有点复杂,具体分析下。
首先利用centos镜像创建了一个容器worker。使用–volumes-from dbdata参数来让worker容器挂载dbdata容器的数据卷(即dbdata数据卷);使用-v $(pwd):/backup参数来挂载本地的当前目录到worker容器的/backup目录。
worker容器启动后,使用了tar cvf /backup/backup.tar /dbdata命令来将/dbdata下内容备份为容器内的/backup/backup.tar,即宿主主机当前目录下的backup.tar。

恢复
如果要恢复数据到一个容器,可以按照下面的操作。首先创建一个带有数据卷的容器dbdata2:

[root@localhost ~]# [root@lch ~]# docker run -it --name dbdata2 -v /dbdata centos /bin/bash

然后创建另一个新的容器,挂载dbdata2容器,并使用untar解压备份文件到所挂载的容器卷中即可:

[root@lch ~]# docker run -it --rm --volumes-from dbdata2 -v $(pwd):/backup busybox tar xf /backup/backup.tar.xz
[root@a3b0d79a4d91 /]# ls dbdata/
abc
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值