docker 数据持久化与数据卷操作

通过文件挂载操作,能够建立起宿主机到容器之间的映射,此后在宿主机中进行的文件修改能够同步到容器中,在容器中进行的文件修改也能够同步到主机中。可以用来将宿主机上的数据导入容器,也可以实现容器中的数据备份和数据迁移功能。

volume,即数据卷,相当于Linux中的目录,Windows中的文件夹。数据卷操作中常用的命令有docker volume 命令,或者可以在docker run 命令中使用-v选项或者–volumes-from选项。

1.卷的创建与删除

数据卷可分为两种,在《Docker in action》中分别称为绑定卷和管理卷。直观上看,两者的区别在于,绑定卷是由用户决定宿主机中的挂载目录,管理卷是由docker决定宿主机中的挂载目录。本质上来讲,绑定卷适用的情况是:当宿主机提供的文件或者目录要挂载到容器中的特定位置时。而管理卷使用时不需要用户手动管理,简化了操作,且可移植性较好。

1.1绑定卷

执行命令docker run -v ~/vol:/vol --name volume1 alpine将宿主机中~/vol目录挂载到容器volume1中/vol目录下。
还可以指定容器的读写权限,执行命令docker run -v ~/vol:/vol:ro --name volume1 alpine把容器对绑定卷的权限设置为只读,可以避免容器中的任何进程修改绑定卷的内容。
注意:1.如果原本在容器volume1的/vol目录下有文件存在,这些旧文件会被覆盖。
接下来对docker -v命令的挂载参数进行分析,-v 命令的参数含义是一个指示文件或目录的路径,有三种情况:不存在、目录、文件。所以有9种组合,列表如下:

宿主机容器结果
不存在不存在挂载成功,先在宿主机中创建空目录,然后挂载到容器中
不存在目录挂载成功,先在宿主机中创建空目录,然后挂载到容器中,容器中原有的目录被覆盖
不存在文件挂载失败,先在宿主机中创建空目录,接下来的操作是把目录挂载到文件上,失败
目录目录挂载成功,容器中的目录被覆盖
目录文件挂载失败,容器会被创建,但不会运行
目录不存在挂载成功,宿主机的目录直接挂载到容器中
文件目录挂载失败,容器会被创建,但不会运行
文件文件挂载成功,容器中的文件被覆盖
文件不存在挂载成功,容器中添加相应的文件

总结一下这个表格:1.宿主机中的路径不存在时,会先创建一个空目录,然后按照目录进行接下来的操作。
2.目录不能映射到文件上,文件也不能映射到目录上。
3.宿主机中的内容会覆盖容器中的相应内容。

1.2管理卷

执行命令docker run -v /vol --name volume2 alpine 将宿主机/var/lib/docker/volumes/(卷ID)/_data 目录(卷ID是由docker守护进程docker daemon决定的)挂载到容器volume2中/vol目录下。卷ID可通过docker inspect -f {{.Mounts}} volume2查看。
注意:如果原本在容器volume2的/vol目录下有文件存在,这些文件会被复制到宿主机上的对应文件夹。

1.3 卷的删除

卷的生命周期是独立于容器的生命周期的,因此在使用docker rm 删除容器时,如果不使用-v选项,则在宿主机上不论是管理卷还是绑定卷都不会被删除。增加-v 选项,只能删除管理卷,无法删除宿主机中的绑定卷。因为绑定卷不在docker的管理范围内。宿主机中的绑定卷只能靠用户手动清除

2.容器之间卷的共享

有两种方式,一种是基于绑定卷的共享,一种是基于管理卷的共享。

2.1 绑定卷的共享

原理:将宿主机上的一个目录同时挂载到两个或多个需要共享数据的容器上。


依次执行命令

  • mkdir ~/volume_share
  • docker run -dit --name volume_share1 -v ~/volume_share:/share1 alpine
  • docker run -dit --name volume_share2 -v ~/volume_share:/share2 alpine

此时,在容器volume_share1的/share1目录下的修改,会同步到容器volume_share2的/share2目录下。同理,在容器volume_share2的/share2目录下的修改,会同步到容器volume_share1的/share1目录下。但是有两点需要注意:第一,如果有多个容器,多个数据卷需要共享,那么使用基于绑定卷的共享会带来管理上的不便,应考虑使用基于管理卷的共享。第二,多个容器竞争同一个文件资源,会造成数据冲突。

2.2 管理卷的共享

在执行docker run 命令时使用–volumes-from选项,可以将一个容器(在有些资料中称之为数据卷容器)的数据卷(包括绑定卷和管理卷),挂载到新启动的容器中。依次执行以下命令:

  • docker run -dit --name volume_share3 -v /share3 alpine
  • docker run -dit --name volume_share4 --volumes-from volume_share2 --volumes-from volume_share3 alpine
  • 接着执行命令docker exec -it volume_share4 sh进入容器volume_share4中查看结果如下:
    在根目录下ls命令结果

可以看到有一个share2目录和一个share3目录。接下来做一个简单的验证,执行命令docker exec -it volume_share2 sh进入容器volume_share2中并在/share2目录下创建一个文件,如下图所示:
在这里插入图片描述
同样的,执行命令docker exec -it volume_share3 sh进入容器volume_share3中并在/share3目录下创建一个文件,如下图所示:
在这里插入图片描述
再回到容器volume_share4中,分别执行cat /share2/test2cat /share3/test3可以看到对应的文件内容。
在这里插入图片描述
使用基于管理卷的共享时有以下三个问题需要注意:
1.共享时卷的位置是固定的,即卷在数据卷容器中的位置。例如在上面的例子中,容器volume_share2中的卷挂载到容器volume_share4中的位置是/share2,容器volume_share3中的卷挂载到容器volume_share4中的位置是/share3,目前位置docker还没有提供挂载到其他的位置上的功能。
2.源卷(即数据卷容器中的卷)之间出现冲突的话,也就是出现相同挂载点的情况时,后挂载的会覆盖先前挂载的。例如在上面的例子的基础上,假设容器volume_share3中的卷挂载到容器volume_share4中的位置也是/share2,则容器volume_share3中的卷会覆盖容器volume_share2中的卷。
3.在新的容器中不能修改卷的权限,例如容器volume_share2中/share2的权限是读写,那么在容器volume_share4中/share2的权限也是读写。这是因为使用–volumes-from选项复制时,是连同卷的定义一起复制的。

2.3 数据备份

假设现在想要备份容器data_test中挂载在/data目录下的数据,一个较好的做法是不在容器data_test中进行操作,而是再启动一个容器来专门执行备份操作,执行下列命令:
docker run --rm --volumes-from data_test -v ~/host_backup:/container_backup alpine tar -cvf /container_backup/data.tar /data
其中–rm选项表示在容器退出时自动删除容器,该容器首先将容器data_test中的/data目录挂载到自己的/data目录下。然后又将宿主机上的 ~/host_backup目录挂载到自己的/container_backup目录下,接着执行tar命令将/data目录下的内容进行压缩,压缩到文件/container_backup/data.tar中,这样在宿主机的~/host_backup目录下也会有一个名为data.tar的压缩文件。实现了数据备份。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值