Docker 数据管理
生产环境使用 Docker 的过程中,往往需要对数据进行持久化,或者需要在多个容器之间进行数据共享,这必然涉及容器的数据管理操作
容器中管理数据的主要方式:
数据卷 (Data Volumes) :容器内数据直接映射到本地主机环境
数据卷容器 (Data Volume Containers) : 使用特定容器维护数据卷
目录
数据卷
数据卷是一个可供容器使用的特殊目录,他将主机操作系统目录直接映射进容器,类似于 Linux 中的 mount 操作
特性
-
数据卷可以在容器之间共享和宠用,容器间传递数据将变得高效方便
-
对数据卷内的数据的修改会立马生效,无论是在容器内操作还是在本地操作
-
对数据卷的更新不会影响镜像,解耦了应用和数据
-
卷会一直存在,直到没有容器使用,可以安全的卸载它
创建数据卷
- 在容器内挂在一个数据卷
在使用 docker run
命令的时候,使用 -v
标记可以在容器内创建一个数据卷。多次重复使用 -v
标记可以创建多个数据卷
下面使用 training/webapp 镜像创建一个 web 容器,并创建一个数据卷挂载到容器的 /webapp 目录
docker run -d -P --name web -v /webapp training/webapp python app.py
-P 将容器服务暴露的接口,是自动映射到本地主机的临时端口
- 挂载一个主机目录作为数据卷
使用 -v
标记也可以指定挂载一个本地的已有目录到容器中作为数据卷(推荐方式)
docker run -d -P --name web -v /src/webapp:/opt/webapp training/webapp python app.py
上面的命令加载主机的 /src/webapp
目录到容器的 /opt/webapp 目录
这个功能在进行测试的时候十分方便,比如用户可以将一些程序或数据放到本地目录中,然后再容器内运行和使用。另外,本地目录的路径必须是绝对路径,如果目录不存在 Docker ,会自动创建
Docker 挂载数据卷的默认权限是 读写(rw) ,用户也可以通过 ro 指定为只读
docker run -d -P --name web -v /src/webapp:/opt/webapp:ro
加了 :ro
之后,容器内对所挂载数据卷内的数据就无法修改了
- 挂载一个本地主机文件作为数据卷
-v
标记也可以从主机挂载单个文件到容器中作为数据卷(不推荐)
docker run --rm -it -v ~/.bash_history:/.bash_history centos:7 /bin/bash
这样就可以记录在容器书如果的命令历史了
如果直接挂在一个文件到容器,使用文件编辑工具, 包裹 vi 或者 sed--in-place 的时候,可能会造成文件 inode 的改变, 从 Docker 1.1.10 起,这会导致报错误信息。所以推荐的方式是直接挂载文件所在的目录。
数据卷容器
如果用户需要在多个容器之间共享一些持续更新的数据,最简单的方式是使用数据卷容器。数据卷容器也是一个容器。但是它的目的是专门用来提供数据卷供其他容器挂载。
创建数据卷容器
首先,创建一个数据卷容器 dbdata,并在其中创建一个数据卷挂载到 /dbdata
[root@localhost ~]# docker run -it -v /dbdata --name dbdata centos:7
[root@e8902ff480f7 /]#
查看 /dbdata 目录
anaconda-post.log bin dbdata dev etc home lib lib64 media mnt opt proc root run sbin srv sys tmp usr var
[root@e8902ff480f7 /]#
然后,可以在其他容器中使用 --volumes-from 来挂载 dbdata 容器中的数据卷
例如创建 db1 和 db2 两个容器,并从 dbdata 容器挂载数据卷
docker run -it --volumes-from dbdata --name db1 centos:7
docker run -it --volumes-from dbdata --name db2 centos:7
此时,容器 db1 和 db2 都挂载同一个数据卷到相同的 /dbdata 目录。三个容器任何一方再该目录下的写入,其他容器都可以看到
示例,我们再 dbdata 容器下的 /dbdate 目录里创建一个test.txt 文件
首先查看容器 docker ps
[root@localhost ~]# docker ps
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
d9b05bebc36c centos:7 "/bin/bash" About an hour ago Up About an hour db2
d795a6be2e1e centos:7 "/bin/bash" About an hour ago Up About an hour db1
e8902ff480f7 centos:7 "/bin/bash" About an hour ago Up About an hour dbdata
进入容器 dbdata ,在 /dbdata 目录下创建文件 test.txt , 退出
[root@localhost ~]# docker exec -it e8902ff480f7 /bin/bash
[root@d9b05bebc36c /]# ls
anaconda-post.log bin dbdata dev etc home lib lib64 media mnt opt proc root run sbin srv sys tmp usr var
[root@d9b05bebc36c /]# cd dbdata/
[root@e8902ff480f7 dbdata]# touch test.txt
[root@e8902ff480f7 dbdata]# exit
进入 容器 db1,查看 /dbdata 目录下的文件是否有 test.txt 文件
[root@localhost ~]# docker exec -it d9b05bebc36c /bin/bash
[root@d9b05bebc36c /]# cd dbdata/
[root@d9b05bebc36c dbdata]# ll
total 0
-rw-r--r--. 1 root root 0 Jan 5 14:00 test.txt
可以看到 存在文件 test.txt
可以多次使用 --volumes-from 参数来从多个容器挂载多个数据卷。还可以从其他已经挂载了容器卷的容器来挂载数据卷.
并且 使用 --volumes-frim 参数所挂载数据卷的容器自身并不惜要保持在运行状态。
如果删除了挂载的容器(包括 dbdata、db1和db2),数据卷并不会被自动删除。如果要删除一个数据卷,必须在删除最后一个还挂载着他的容器时,必须显式使用 docker rm -v 命令来指定同时删除关联的容器。
使用数据卷容器可以让用户在容器之间自由地升级和移动数据卷。
利用数据卷迁移数据
可以利用数据卷容器对其中的数据卷进行备份、恢复,以实现数据的迁移。
备份
docker run --volumes-from dbdata -v $(pwd):/backup --name worker centos:7 tar cvf /backup/backup.tar /dbdata
这个命令有点复杂。
-
centos:7 镜像创建了一个 worker 容器。
-
使用 --volumes-from dbdata 参数来让 worker 容器挂载 dbdata 容器地数据卷(即 dbdata数据卷)
-
使用 -v $(pwd):/backup 参数来挂载本地的当前目录到 worker 容器的 /backup 目录
-
worker 容器启动后,使用 tar cvf /backup/backup.tar /dbdata 命令来讲 /dbdata 下的内容备份为容器内的 /backup/backup.tar ,即宿主主机当前目录下的 backup.tar
恢复
如果要将数据恢复到一个容器,
首先先创建一个带有数据卷的容器 dbdata2:
docker run -v /dbdata --name dbdata2 centos:7 /bin/bash
然后创建另一个新的容器,挂载 dbdata2 的容器,并使用 untar 解压备份文件到所挂载的容器卷中:
docker run --volumes-from dbdata2 -v $(pwd):/backup busybox tar xvf /backup/backup.tar