Dockerfile概念简介——镜像分层
一、dockerfile概念
- dockerfile是自定义镜像 的一套规则
- dockerfile由多条指令构成,Dockerfile中的每一条指令都会对应于Docker镜像中的每一层
1.1docker镜像的分层
dockerfile的原理就是镜像分层。
- Dockerfile 中的每个指令都会创建一个新的镜像层 (是一个临时的容器,执行完后将不再存在,再往后进行重新的创建与操作)
- 镜像层将被缓存和复用 (后续的镜像层将基于前面的一层,每一层都会有下几层的缓存)
- 当 Dockerfile 的指令修改了,复制的文件变化了,或者构建镜像时指定的变量不同了(后续操作必然更改前面的镜像层),那么对应的镜像层缓存就会失效(就会自动销毁)
- 某一层的镜像缓存失效之后,它之后的镜像层缓存就都会失效(第一层不成功,那么第二层也就再成功,相当于地基)
- 容器的修改并不会影响镜像 ,如果在某一层中添加一个文件,在下一层中删除它,镜像中依然会包含该文件
二、Docker镜像的创建
2.1基于dockerfile创建
dockerfile是由一组指令组 成的文件
dockerfile每行支持一条指令,每条指令可携带多个参数,一条指令可以用&&方式,去写多条指令。
dockerfile支持以“#”为开头的注释
2.1.1dockerfile 结构(四部分)
- 基础镜像信息(Linux发行版:centos ubantu suse debian alpine redhat)
- 维护者信息(docker search可查看)
- 镜像操作指令(tar yum make)
- 容器启动时执行指令(cmd[“/root/run.sh”] 、entrypoint 都是系统启动时,第一个加载的程序/脚本/命令)
三、dockerfile操作指令
指令 | 含义 |
---|---|
FROM [镜像] | 指定新镜像所基于的镜像,第一条指令必须为FROM指令,每创建一个镜像就需要一条FROM指令,例如centos:7。from有两层含义:①开启一个新的镜像②必须写的一行指令 |
MAINTAINER [名字] | 说明新镜像的维护人信息(可写可不写) |
RUN命令 | 每一条RUN后面跟一条命令,在所基于的镜像上执行命令,并提交到新的镜像中,RUN必须大写 |
CMD [“要运行的程序”,“参数1”、“参数2”] | 指定启动容器时需要运行的命令或者脚本,Dockerfile只能有一条CMD命令,如果指定多条则只能执行最后一条,“bin/bash”也是一条CMD,并且会覆盖image镜像里面的cmd。 |
EXPOSE [端口号] | 指定新镜像加载到Docker时要开启的端口**(暴露端口)** ,就是这个容器暴露出去的端口号。 |
ENV [环境变量] [变量值] | 设置一个环境变量 的值,会被后面的RUN使用。容器可以根据自己的需求创建时传入环境变量,镜像不可以。 |
ADD [源文件/目录] [目标文件/目录] | ①将源文件复制到目标文件,源文件要与Dockerfile位于相同目录中 ,②或者是一个URL,③若源文件是压缩包则会将其解压缩 |
COPY [源文件/目录] [目标文件/目录] | 将本地主机上的文件/目录复制到目标地点,源文件/目录要与Dockerfile在相同的目录中,copy只能用于复制,add复制的同时,如果复制的对象是压缩包,ADD还可以解压, copy比add节省资源 |
VOLUME [“目录”] | 在容器中创建一个挂载点,简单来说就是-v,指定镜像的目录挂载到宿主机上。 |
USER [用户名/UID] | 指定运行容器时的用户 |
WORKDIR [路径] | 为后续的RUN、CMD、ENTRYPOINT指定工作目录,相当于是一个临时的"CD", 否则需要使用绝对路径,例如workdir /opt。移动到opt目录,并在这下面的指令都是在opt下执行。 |
ONBUILD [命令] | 指定所生成的镜像作为一个基础镜像时所要运行的命令**(是一种优化)** |
HEALTHCHECK | 健康检查 |
(1) FROM 镜像
- 指定新镜像所基于的基础镜像,第一条指令必须为FROM指令,每创建一个镜像就需要一条FROM指令
(2) MAINTAINER 名字
- 说明新镜像的维护人信息
(3) RUN命令
- 在所基于的镜像上执行命令,并提交到新的镜像中
(4) ENTRYPOINT [“要运行的程序”,“参数1”, “参数2”]
- 设定容器启动时第一一个运行的命令及其参数。
- 可以通过使用命令dockerrun–entrypoint来覆盖镜像中的ENTRYPOINT指令的内容。
(5) CMD [“要运行的程序”,“参数1”, “参数2”]
上面的是exec形式, shell形式: CMD 命令 参数1 参数2
-
启动容器时默认执行的命令或者脚本,Dockerfile只 能有一条CMD命令。如果指定多条命令,只执行最后一条命令。
-
如果在dockerrun时指定了命令或者镜像中有ENTRYPOINT,那么cmd就会被覆盖。
CMD可以为ENTRYPOINT 指令提供默认参数ENTRYPOINT ["echo"] CMD ["test2"]
(6) EXPOSE 端口号
- 指定新镜像加载到Docker时要开启的端口
(7)ENV 环境变量变量值
- 设置一个环境变量的值,会被后面的RUN使用
(8) ADD 源文件/目录目标文件/目录
- 将源文件复制到镜像中,源文件要与Dockerfile 位于相同目录中,或者是一个URL
有如下注意事项:
- 如果源路径是个文件,且目标路径是以/结尾, 则docker会把目标路径当作一一个目录, 会把源文件拷贝到该目录下。
- 如果目标路径不存在,则会自动创建目标路径。
2.如果源路径是个文件,且目标路径是不是以/结尾,则docker会把目标路径当作一个文件。
- 如果目标路径不存在,会以目标路径为名创建一个文件,内容同源文件;
- 如果目标文件是个存在的文件,会用源文件覆盖它,当然只是内容覆盖,文件名还是目标文件名。
- 如果目标文件实际是个存在的目录,则会源文件拷贝到该目录下。注意,这种情况下,最好显示的以/结尾,以避免混淆。
3、如果源路径是个目录,且目标路径不存在,则docker会自动以目标路径创建一个目录,把源路径目录下的文件拷贝进来。
- 如果目标路径是个已经存在的目录,则docker 会把源路径目录下的文件拷贝到该目录下。
4、如果源文件是个归档文件(压缩文件),则docker会自动帮解压。
- URL"下载和解压特性不能一 起使用。任何压缩文件通过URI拷贝, 都不会自动解压。
(9) COPY 源文件/目录目标文件/目录
- 只复制本地主机上的文件/目录复制到目标地点,源文件/目录要与Dockerfile 在相同的目录中
(10) VOLUME [“目录”]
- 在容器中创建一个挂载点.
(11) USER 用户名/UID
- 指定运行容器时的用户
(12) WORKDIR路径
- 为后续的RUN、 CMD、 ENTRYPOINT 指定工作目录
(13) |ONBUILD命令
- 指定所生成的镜像作为一个基础镜像时所要运行的命令。
- 当在一个Dockerfile文件中加_上ONBUILD指令,该指令对利用该Dockerfile构建镜像(比如为A镜像)不会产生实质性影响。
- 但是当编写一个新的Dockerfile文件来基于A镜像构建一个镜像 ( 比如为B镜像)时,这时构造A镜像的Dockerfile文件中的ONBUILD指令就生效了,在构建B镜像的过程中,首先会执行0NBUILD指令指定的指令,然后才会执行其它指令。
(14 ) HEALTHCHECK
- 健康检查
四、Dockerfile案例
在编写Dockerfile时,有严格的格式需要遵循:
- 第一行必须使用 FROM 指令指明所基于的镜像名称;
- 之后使用 MAINTAINER 指令说明维护该镜像的用户信息;
- 然后是镜像操作相关指令,如RUN指令。每运行一条指令,都会给基础镜像添加新的一层;
- 最后使用CMD指令指定启动容器时要运行的命令操作。
代码清单
#建立工作目录
mkdir /opt/ apache
cd /opt/ apache
vim Dockerfile
#基于的基础镜像
FROM centos:7
#维护镜像的用户信息
MAINTAINER this is apache image <wdc,2021.7.27>
#镜像操作指令安装apache软件
RUN yum -y update
RUN yum -y install httpd
#开启 80 端口
EXPOSE 80
#复制网站首页文件
ADD index.html /var/www/html/index.html
//方法一:
#将执行脚本复制到镜像中
ADD run.sh /run.sh
RUN chmod 755 /run.sh
#启动容器时执行脚本
CMD ["/run.sh"]
//方法二:
ENTRYPOINT [ "/usr/sbin/apachectl" ]
CMD ["-D", "FOREGROUND"]
//准备执行脚本
vim run.sh
#!/bin/bash
rm -rf /run/httpd/* #清理httpd的缓存
exec /usr/sbin/apachectl -D FOREGROUND #指定为前台运行
#因为Docker容器仅在它的1号进程(PID为1)运行时,会保持运行。如果1号进程退出了,Docker容 器也就退出了。
//准备网站页面
echo "this is test web" > index.html
//生成镜像
docker build -t httpd:centos7 . #注意别忘了末尾有"."
//新镜像运行容器
docker run -d -p 1216:80 httpd:centos7
//外主机测试
http://192.168.61.11:1216/
########如果有网络报错提示########
[Warning] IPv4 forwarding is disabled. Networking will not work.
解决方法:
vim /etc/sysctl.conf
net.ipv4.ip_forward=1
sysctl -P
systemctl restart network
systemct1 restart docker
总结
1、为什么、docker的centos镜像只有200M多一点
- 因为docker镜像只有rootts和其他镜像层,共用宿主机的linux内核(bootfs) ,因此很小
- bootfs + rootfs :作用是加载、引导内核程序+挂载使用linux操作系统(centos ubantu)等等一些关键的目录文件。
- 就是说bootsfs用内核的,rootfs用自己的
- 对于一个精简的os,rootfs可以很小,只需要包括最基本的命令、工具和程序库就可以了,因为底层直接用Rost的kernel,自己只需要提供rootfs就行了。所以对于不同的linux发行版,bootfs基本是一致的,rootfs会有差别,所以不同的发行版可以公用bootfs
2、LXC和容器是什么关系?
- LXC是内核中容器技术/驱动,功能是将资源容器化。完成资源容器虚拟化的过程。是早期docker的依赖组件目前docker 拥有自己的libcontianer库。可以实现容器虚拟化的功能,对LXC依赖性大大降低。
3、dockerfile镜像分层的原理
- 用overlay2存储引擎的方式叠加上去,最上面是容器层是可读可写的,其他镜像是可读的;
- 他们是共用的内核资源,共用的是操作系统里所必须的引导程序,挂载,系统之间的文件;
- 这些文件他和内核之间共享,所以他比实际的centos要小。
4、容器之间相互通信的方式
docker 0 、 数据卷容器 、 --link 隧道 、 container 模式(直连接口,同一个network namespaces里,通过同一个网卡的方式,在同一个名称空间里 共有一个IP,通过localhost交互/自己的ip或端口交互)
5、ADD和copy区别
Dockerfile中的COPY指令和ADD指令都可以将主机上的资源复制或加入到容器镜像中,都是在构建镜像的过程中完成的:
- copy只能用于复制(节省资源)
- ADD复制的同时,如果复制的对象时压缩包,ADD还可以解压(消耗资源)
- COPY指令和ADD指令的唯一区别在于是否支持从远程URL获取资源。COPY指令只能从执行docker build所在的主机上读取资源并复制到镜像中。而ADD指令还支持通过URL从远程服务器读取资源并复制到镜像中
- 满足同等功能的情况下,推荐使用COPY指令。ADD指令更擅长读取本地tar文件并解压缩
6、cmd和entrypoint区别
首先要讲一讲exec和shell的区别:
- exec: 容器加载时使用的启动的第一个任务进程
- shell: 容器加载时使用的第一个bash (/bin/bash /bin/sh /bin/init)
- 如果 entrypoint使用了shell模式,CMD指令会被忽略。
- 如果entrypoint使用了exec模式,CMD指定的内容被追加为 entrypoint指定命令的参数。
- 如果entrypoint使用了exec模式,CMD也应该使用exec模式。
- cmd是容器环境启动时默认加载的命令
entrypoint是容器环境启动时第一个加载的命令程序/脚本程序 init
6、AUFS 与overlay/ overlay2 (docker高版本)
-
AUFS是一种联合文件系统。它使用同一个Linuxhost上的多个目录,逐个堆叠起来,对外呈现出一个统一的文件系统。AUrs使用该特性,实现了Docker镜像的分层
-
而docker使用了overlay/overlay2存储驱动来支持分层结构overlays将单个Linux主机上的两个目录合并成一个目录。这些目录被称为层,统一过程被称为联合挂载
-
overlay 结构
overlayfs在linux主机上只有两层,一个目录在下层,用来保存镜像(docker),另外一个目录在上层,用来存储容器信息
- rootfs 基础镜像
- lower 下层信息、(为境像层,可读)
- upper 上层目录(容器信息,可读可写)
- work 运行的工作目录(copy-on-write写时复制-》准备容器环境)
- merged "视图层”(容器视图)