docker镜像管理基础
镜像的概念
镜像可以理解为应用程序的集装箱,而docker用来装卸集装箱。
docker镜像含有启动容器所需要的文件系统及其内容,因此,其用于创建并启动容器。
docker镜像采用分层构建机制,最底层为bootfs,其上为rootfs
- bootfs:用于系统引导的文件系统,包括bootloader和kernel,容器启动完成后会被卸载以节约内存资源
- rootfs:位于bootfs之上,表现为docker容器的根文件系统
- 传统模式中,系统启动之时,内核挂载rootfs会首先将其挂载为“只读”模式,完整性自检完成后将其重新挂载为读写模式
- docker中,rootfs由内核挂载为“只读”模式,而后通过“联合挂载”技术额外挂载一个“可写”层
注意:当删除容器时,这个容器自有的“可写”层会一起被删除
docker镜像层
位于下层的镜像称为父镜像(parrent image),最底层的称为基础镜像(base image);
最上层为“可读写”层,其下的均为“只读”层。
docker存储驱动
docker提供了多种存储驱动来实现不同的方式存储镜像,下面是常用的几种存储驱动:
- AUFS
- OverlayFS
- Devicemapper
- Btrfs
- VFS
AUFS(已淘汰)
AUFS(AnotherUnionFS)是一种Union FS,是文件级的存储驱动。AUFS是一个能透明覆盖一个或多个现有文件系统的层状文件系统,把多层合并成文件系统的单层表示。简单来说就是支持将不同目录挂载到同一个虚拟文件系统下的文件系统。这种文件系统可以一层一层地叠加修改文件。无论底下有多少层都是只读的,只有最上层的文件系统是可写的。当需要修改一个文件时,AUFS创建该文件的一个副本,使用CoW将文件从只读层复制到可写层进行修改,结果也保存在可写层。在Docker中,底下的只读层就是image,可写层就是Container。
AUFS文件系统据说有3W行代码,而ext4文件系统却只有4000-5000行左右代码,这些代码是要被整合进内核的,后来AUFS申请要被合并进内核代码的时候,linuz觉得它这代码太过臃肿,于是拒绝了。因此AUFS这个文件系统一直以来就不是linux内核中自有的文件系统,想用AUFS这个文件系统的话,必须自己向内核打补丁并去编译使用它,但redhat系列的操作系统一向以稳定著称,不会干这种出格的事,所以在redhat系列操作系统中使用AUFS并无可能。而ubuntu上的docker默认使用的就是AUFS。
OverlayFS
Overlay是Linux内核3.18后支持的,也是一种Union FS,和AUFS的多层不同的是Overlay只有两层:一个upper文件系统和一个lower文件系统,分别代表Docker的镜像层和容器层。当需要修改一个文件时,使用CoW将文件从只读的lower复制到可写的upper进行修改,结果也保存在upper层。在Docker中,底下的只读层就是image,可写层就是Container。目前最新的OverlayFS为Overlay2。
AUFS和Overlay都是联合文件系统,但AUFS有多层,而Overlay只有两层,所以在做写时复制操作时,如果文件比较大且存在比较低的层,则AUSF会慢一些。而且Overlay并入了linux kernel mainline,AUFS没有。目前AUFS已基本被淘汰。
DeviceMapper
Device mapper是Linux内核2.6.9后支持的,提供的一种从逻辑设备到物理设备的映射框架机制,在该机制下,用户可以很方便的根据自己的需要制定实现存储资源的管理策略。AUFS和OverlayFS都是文件级存储,而Device mapper是块级存储,所有的操作都是直接对块进行操作,而不是文件。Device mapper驱动会先在块设备上创建一个资源池,然后在资源池上创建一个带有文件系统的基本设备,所有镜像都是这个基本设备的快照,而容器则是镜像的快照。所以在容器里看到文件系统是资源池上基本设备的文件系统的快照,并没有为容器分配空间。当要写入一个新文件时,在容器的镜像内为其分配新的块并写入数据,这个叫用时分配。当要修改已有文件时,再使用CoW为容器快照分配块空间,将要修改的数据复制到在容器快照中新的块里再进行修改。
OverlayFS是文件级存储,Device mapper是块级存储,当文件特别大而修改的内容很小,Overlay不管修改的内容大小都会复制整个文件,对大文件进行修改显然要比小文件要消耗更多的时间,而块级无论是大文件还是小文件都只复制需要修改的块,并不是整个文件,在这种场景下,显然device mapper要快一些。因为块级的是直接访问逻辑盘,适合IO密集的场景。而对于程序内部复杂,大并发但少IO的场景,Overlay的性能相对要强一些。
docker registry
启动容器时,docker daemon会试图从本地获取相关的镜像,本地镜像不存在时,其将从Registry中下载该镜像并保存到本地。
Registry用于保存docker镜像,包括镜像的层次结构和元数据。用户可以自建Registry,亦可使用官方的Docker Hub。
docker registry的分类:
- Sponsor Registry:第三方的Registry,供客户和Docker社区使用
- Mirror Registry:第三方的Registry,只让客户使用
- Vendor Registry:由发布docker镜像的供应商提供的registry
- Private Registry:通过设有防火墙和额外的安全层的私有实体提供的registry
docker registry的组成:
- Repository
- 由某特定的docker镜像的所有迭代版本组成的镜像仓库
- 一个Registry中可以存在多个Repository
- Repository可分为“顶层仓库”和“用户仓库”
- 用户仓库名称格式为“用户名/仓库名”
- 每个仓库可包含多个Tag(标签),每个标签对应一个镜像
- Index
- 维护用户帐户、镜像的检验以及公共命名空间的信息
- 相当于为Registry提供了一个完成用户认证等功能的检索接口
Docker Registry中的镜像通常由开发人员制作,而后推送至“公共”或“私有”Registry上保存,供其他人员使用,例如“部署”到生产环境。
docker镜像的制作
多数情况下,我们做镜像是基于别人已存在的某个基础镜像来实现的,我们把它称为base image。比如一个纯净版的最小化的centos、ubuntu或debian。
那么这个最小化的centos镜像从何而来呢?其实这个基础镜像一般是由Docker Hub的相关维护人员,也就是Docker官方手动制作的。这个基础镜像的制作对于Docker官方的专业人员来说是非常容易的,但对于终端用户来说就不是那么容易制作的了。
docker Hub
Docker Hub是一个基于云的注册服务,它允许您链接到代码仓库,构建和测试映像,存储手动推送的映像,并链接到Docker Cloud,以便您可以将映像部署到您的主机。
它为容器镜像的发现、分发和变更管理、用户和团队协作以及整个开发流水线的工作流自动化提供了集中的资源。
docker镜像的获取
要从远程镜像仓库(比如你自己的Docker镜像仓库)获取Docker镜像,并将它们添加到本地系统,使用Docker pull命令:
# docker pull <registry>[:<port>]/[<namespace>/]<name>:<tag>
例:[root@localhost ~]# docker pull hte666/apache:v0.3
The is a host that provides the docker-distribution service on TCP (default:5000)
Together, and identify a particular image controlled by at the registry
- Some registries also support raw ;for those, is optional
- When it is included, however, the additional level of hierarchy that provides is usefull to distinguish between images with the same
The additional level of hierarchy of
Namespace | Examples(/) |
---|---|
organization | redhat/kubernetes, google/kubernetes |
login(username) | Alice/application, bob/application |
role | devel/database, test/database, prod/database |
镜像的生成
镜像的生成途径:
- Dockerfile
- 基于容器制作
- Docker Hub automated builds
基于容器制作镜像
根据容器的修改来制作镜像
docker commit 命令: 从容器创建一个新的镜像。
docker commit [OPTIONS] CONTAINER [REPOSITORY[:TAG]]
#docker commit +选项 容器 [产生新的镜像:版本号]
选项 | 默认 | 描述 |
---|---|---|
-a,—author | 写上作者的信息 | |
-c, --change list | 应用你的修改 | |
-m, --message string | 提交修改 | |
-p, --pause | true | 在提交期间暂停容器 |
[root@localhost ~]# docker pull centos:8 #拉取一个centos系统的基础镜像
8: Pulling from library/centos
a1d0c7532777: Pull complete
Digest: sha256:a27fd8080b517143cbbbab9dfb7c8571c40d67d534bbdee55bd6c473f432b177
Status: Downloaded newer image for centos:8
docker.io/library/centos:8
[root@localhost ~]# docker images
REPOSITORY TAG IMAGE ID CREATED SIZE
httpd latest dabbfbe0c57b 22 months ago 144MB
centos 8 5d0da3dc9764 2 years ago 231MB
[root@localhost ~]#
[root@localhost ~]# docker run -it --rm centos /bin/bash #创建容器 --rm表示创建临时容器的镜像为centos
Unable to find image 'centos:latest' locally
latest: Pulling from library/centos
Digest: sha256:a27fd8080b517143cbbbab9dfb7c8571c40d67d534bbdee55bd6c473f432b177
Status: Downloaded newer image for centos:latest
[root@0beb2555aba8 /]# ls
bin dev etc home lib lib64 lost+found media mnt opt proc root run sbin srv sys tmp usr var
[root@0beb2555aba8 /]# mkdir /data
[root@0beb2555aba8 /]# echo "hello world" > data/index.html
[root@0beb2555aba8 /]# cat data/index.html #在centos的基础镜像产生的容器中创建一个文件
hello world
[root@0beb2555aba8 /]#
在创建镜像时,我们不能关闭容器,必须使其处于运行状态,所以我们必须要另起一个终端,然后执行
[root@localhost ~]# docker ps #查看正在运行的容器
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
0beb2555aba8 centos "/bin/bash" 14 minutes ago Up 14 minutes hopeful_ptolemy
[root@localhost ~]# docker commit -p 0beb2555aba8 #暂停容器
sha256:c3c9210c0979dd0889ba5c29a15426987a482fbaea7eba513c3390273cfc6051
[root@localhost ~]# docker images #查看镜像
REPOSITORY TAG IMAGE ID CREATED SIZE
<none> <none> c3c9210c0979 17 seconds ago 231MB #由于没有赋予这个镜像名字使用只有ID
centos 8 5d0da3dc9764 2 years ago 231MB
centos latest 5d0da3dc9764 2 years ago 231MB
[root@localhost ~]# docker tag c3c9210c0979 hte666/centos8:vo.1 标记镜像为hte666/centos8:vo.1,hte666是仓库名
[root@localhost ~]# docker images
REPOSITORY TAG IMAGE ID CREATED SIZE
hte666/centos8 vo.1 c3c9210c0979 4 minutes ago 231MB
centos 8 5d0da3dc9764 2 years ago 231MB
centos latest 5d0da3dc9764 2 years ago 231MB
[root@localhost ~]#
[root@localhost ~]# docker login #登录仓库
Log in with your Docker ID or email address to push and pull images from Docker Hub. If you don't have a Docker ID, head over to https://hub.docker.com/ to create one.
You can log in with your password or a Personal Access Token (PAT). Using a limited-scope PAT grants better security and is required for organizations using SSO. Learn more at https://docs.docker.com/go/access-tokens/
Username: hte666 #输入用户名
Password: #输入密码
WARNING! Your password will be stored unencrypted in /root/.docker/config.json.
Configure a credential helper to remove this warning. See
https://docs.docker.com/engine/reference/commandline/login/#credentials-store
Login Succeeded #有这一行表示登录成功
[root@localhost ~]#
[root@localhost ~]# docker push hte666/centos8:vo.1 #把镜像传输到仓库
The push refers to repository [docker.io/hte666/centos8]
8b071c883c7b: Pushed
74ddd0ec08fa: Mounted from library/centos
vo.1: digest: sha256:09d327519f81b0bde136ced1542e4c7528789d5d5c36a34480c7b76d12bb8018 size: 736
[root@localhost ~]#
此时要注意的是,我们的仓库名叫hte666,所以我们要在Docker Hub上创建一个名为hte666的仓库,然后再将我们做好的镜像push上去
使用新生成的镜像创建容器
[root@localhost ~]# docker images
REPOSITORY TAG IMAGE ID CREATED SIZE
hte666/centos8 vo.1 c3c9210c0979 18 minutes ago 231MB
centos 8 5d0da3dc9764 2 years ago 231MB
centos latest 5d0da3dc9764 2 years ago 231MB
[root@localhost ~]# docker run -it --rm hte666/centos8:vo.1 #使用的-it模式不用跟 /bin/bash
[root@4cd9f32620cd /]# ls
bin data dev etc home lib lib64 lost+found media mnt opt proc root run sbin srv sys tmp usr var
[root@4cd9f32620cd /]# ls /data/
index.html
[root@4cd9f32620cd /]# cat /data/index.html #原来的基础镜像是没有这个文件的,说明我们的镜像创建成功
hello world
[root@4cd9f32620cd /]#
由此可见,新生成的镜像中是包含了新增的内容的,但是此时有一个问题,那就是容器默认要启动的进程是什么?在这里,默认情况下是启动的bash进程,但我们是要启动一个http站点,所以我们要在创建镜像时将容器默认启动的进程设为httpd,这样一来我们就可以通过新生成的镜像来快速构建一个简单的http站点了。
使用docker inspect
命令查看b1容器启动的默认进程是什么
[root@localhost ~]# docker inspect b1
[
...此处省略N行
"Cmd": [
"/bin/bash" #Cmd就是容器启动后默认要启动的东西
],
"Image": "centos",
"Volumes": null,
"WorkingDir": "",
"Entrypoint": null,
"OnBuild": null,
...此处省略N行
]
所以要重新生成镜像并上传
[root@localhost ~]# docker commit -a 'sean <sean1002@126.com>' -c 'CMD ["/bin/httpd","-f","-h","/data"]' -p b1 seancheng1002/b1:v0.2
[root@localhost ~]# docker push seancheng1002/b1
使用新生成的镜像创建容器
[root@localhost ~]# docker run --name t2 -d seancheng1002/b1:v0.2
98708886e332243bb64dac32f7e5210c8219e30495150c8fde4938d5d748ada7
[root@localhost ~]# docker container ls
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
98708886e332 seancheng1002/b1:v0.2 "/bin/httpd -f -h /d…" 7 seconds ago Up 5 seconds t2
a2e954da2011 busybox "sh" About an hour ago Up About a minute b1
使用docker inspect
命令查看t2容器启动的默认进程是什么,以及其IP地址,然后用curl命令访问该IP,看是否能访问到网页
[root@localhost ~]# curl 172.17.0.3
Busybox page test.
镜像的导入与导出
假如有2台主机,我们在主机1上做了一个镜像,主机2想用这个镜像怎么办呢?
我们可以在主机1上push镜像到镜像仓库中,然后在主机2上pull把镜像拉下来使用,这种方式就显得比较麻烦,假如我只是测试用的,在一台主机上做好镜像后在另一台主机上跑一下就行了,没必要推到仓库上然后又把它拉到本地来。
此时我们可以在已有镜像的基础上把镜像打包成一个压缩文件,然后拷贝到另一台主机上将其导入,这就是镜像的导入和导出功能。
docker中我们使用docker save
进行导出,使用docker load
进行导入。
在已生成镜像的主机上执行docker save导出镜像
docker save -o myimages.tar hte666/centos8
在另一台没有镜像的主机上执行docker load导入镜像
docker load -i myimages.gz
一台主机上做好镜像后在另一台主机上跑一下就行了,没必要推到仓库上然后又把它拉到本地来。
此时我们可以在已有镜像的基础上把镜像打包成一个压缩文件,然后拷贝到另一台主机上将其导入,这就是镜像的导入和导出功能。
docker中我们使用`docker save`进行导出,使用`docker load`进行导入。
在已生成镜像的主机上执行docker save导出镜像
```text
docker save -o myimages.tar hte666/centos8
在另一台没有镜像的主机上执行docker load导入镜像
docker load -i myimages.gz