文章目录
一、基本结构
Dockerfile主体部分主要分为四部分:基础镜像信息、维护者信息、镜像操作指令和容器启动时执行指令。
下面给出一个简单的示例
# escape=\ (backslash)
# This dockerfile uses the ubuntu:xeniel image
# VERSION 2 -EDITION 1
# Author: docker_user
# Command format: Instruction [arguments / command] ..
# Base image to use, this must be set as the first line
FROM ubuntu:xeniel
# Maintainer: docker_user <docker_user at email.com> (@docker_user)
LABEL maintainer docker_user<docker_user@email.com>
# Command to update the image
RUN echo "deb http://archive.ubuntu.com/ubuntu/ xeniel main universe" >> /etc/apt/source.list
RUN apt-get update && apt-get install -y nginx
RUN echo "\ndaemon off;" >> /etc/nginx/nginx.conf
# Commands when creating a new container
CMD /usr/sbin/nginx
首行可以通过注释来指定解析器命令,后续通过注释说明镜像的相关信息。
主体部分首先使用FROM指令指明所基于的镜像的名称,接下来一般是使用LABEL命令说明维护者信息。
后面则是镜像操作指令,例如RUN命令将对镜像的执行跟随的命令。每运行一条RUN指令,镜像添加新的一层,并提交。
最后是CMD指令,来指定运行容器时的操作命令。
二、指令说明
Dockerfile中指令的一般格式为INSTRUCTION arguments
,包括“配置指令”(配置镜像信息)和“操作指令”(具体执行操作)
Dockerfile的配置指令及其说明:
配置指令 | 说明 |
---|---|
ARG | 定义创建镜像过程中使用的变量 |
FROM | 指定所创建镜像的基础镜像 |
LABEL | 为生成的镜像添加元数据标签信息 |
EXPOSE | 声明镜像内服务监听的端口 |
ENV | 指定环境变量 |
ENTRYPOINT | 指定镜像的默认入口命令 |
VOLUME | 创建一个数据卷挂载点 |
USER | 指定运行容器时的用户名或UID |
WORKDIR | 配置工作目录 |
ONBUILD | 创建子镜像时指定自动执行的操作命令 |
STOPSIGNAL | 指定退出的信号值 |
HEALTHCHECK | 配置所启动容器如何进行健康检查 |
SHELL | 指定默认shell类型 |
Dockerfile的操作指令及其说明:
操作指令 | 说明 |
---|---|
RUN | 运行指定命令 |
CMD | 启动容器时指定默认执行的命令 |
ADD | 添加内容到镜像 |
COPY | 复制内容到镜像 |
2.1 配置命令
1. ARG
定义创建镜像过程中使用的变量。
格式为ARG <name>[=<default value>]
。
在执行docker build
时,可以通过-build-arg[=]
来为变量赋值。当镜像编译成功后,ARG指定的变量将不再存在(ENV指定的变量将在镜像中保留)。
Docker内置了一些镜像创建变量,用户可以直接使用而无需声明,包括(不区分大小写)HTTP_PROXY、HTTPS_PROXY、FTP_PROXY、NO_PROXY。
2. FROM
指定所创建镜像的基础镜像。
格式为FROM <image> [AS <name>]
或FROM <image>:<tag> [AS <name>]
或FROM <image>@<digest> [AS <name>]
。
任何Dockerfile中的第一条指令必须为FROM指令。并且,如果在同一个Dockerfile中创建多个镜像时,可以使用多个FROM指令(每个镜像一次)。
为了保证镜像精简,可以选用体积较小的镜像如Alpine或Debian作为基础镜像。例如:
ARG VERSION=9.3
FROM debian:${VERSION}
3. LABEL
LABLE指令可以为生成的镜像添加元数据标签信息。这些信息可以用来辅助过滤出特定镜像。
格式为LABEL <key>=<value> <key>=<value> <key>=<value>...
例如:
LABEL version="1.0.0-rc3"
LABEL author="Annie0321@github" date="2022-11-07"
LABEL description="This text illustrates \
that label-values can span multiple lines."
4. EXPOSE
声明镜像内服务监听的端口。
格式为EXPOSE <port> [<port>/<protocol>...]
。
例如:
EXPOSE 22 80 8443
注意:该指令只是起到声明作用,并不会自动完成端口映射。
如果要映射端口出来,在启动容器时可以使用-P
参数(Docker主机会自动分配一个宿主机的临时端口)或-p HOST_PORT:CONTAINER_PORT
参数
5. ENV
指定环境变量,在镜像生成的过程中会被后续RUN指令使用,在镜像启动的容器中也会存在格式为ENV <key> <value>
或ENV <key>=<value>...
。
例如:
ENV APP_VERSION=1.0.0
ENV APP_HOME=/usr/local/app
ENV PATH $PATH:/usr/local/bin
指定环境的变量在运行时可以被覆盖掉,如docker run --env <key>=<value> built_image
。
注意:当一条ENV指令中同时为多个环境变量赋值并且值也是从环境变量读取时,会为变量都福祉后再更新。如下面的指令,最终结果为key1=value1 key2=value2:
ENV key1=value2
ENV key1=value1 key2=${key1}
6. ENTRYPOINT
指定镜像的默认入口命令,该入口命令会在启动容器时作为根命令执行,所有传入值作为该命令的参数。
支持两种格式:
ENTRYPOINT["executable", "param1", "param2"]: exec 调用执行
ENTRYPOINT command param1 param2: shell 执行
此时,CMD指令指定值将作为根命令的参数。
每个Dockerfile中只能有一个ENTRYPOINT,当指定多个时,只有最后一个起效。在运行时,可以被--entrypoint
参数覆盖掉,如docker run --entrypoint
。
7. VOLUME
创建一个数据挂载点。
格式为VOLUME ["/data"]
。
运行容器时可以从本地主机或其他容器挂载数据卷,一般用来存放数据库和需要保持的数据等。
8. USER
指定容器运行时的用户名或UID,后续的RUN等指令也会使用指定的用户身份。
格式为USER daemon
。
当服务不需要管理员权限时,可以通过该命令指定运行用户,并且可以在Dockerfile中创建所需要的用户。例如:
RUN groupadd -r postgres && useradd --no-log-init -r -g postgres postgres
要临时获取管理员权限可以使用gosu命令。
9. WORKDIR
为后续的RUN、CMD、ENTRYPOINT指令配置工作目录。
格式为WORKDIR /path/to/workdir
。
可以使用多个WORKDIR指令,后续命令如果参数是相对路径,则会基于之前命令指定的路径。例如:
WORKDIR /a
WORKDIR b
WORKDIR c
RUN pwd
则最终路径为/a/b/c
因此,为了避免出错,推荐WORKDIR指令中只使用绝对路径。
10. ONBUILD
指定当基于所生成镜像创建子镜像时,自动执行的操作指令。
格式为ONBUILD [INSTRUCTION]
。
例如,使用如下的Dockerfile创建父镜像ParentImage,指定ONBUILD指令:
# Dockerfile for ParentImage
[...]
ONBUILD ADD . /app/src
ONBUILD RUN /usr/local/bin/python-build --dir /app/src
[...]
使用docker build命令创建子镜像ChildImage时(FROM ParentImage),会首先执行ParentImage中配置的ONBUILD指令:
# Dockerfile for ChildImage
FROM ParentImage
等价于在ChildImage的Dockerfile中添加了如下指令:
# Automaticallly run the following when building ChildImage
ADD . /app/src
RUN /usr/local/bin/python-build --dir /app/src
...
由于ONBUILD指令是隐式执行的,推荐在使用它的镜像标签中进行标注,例如ruby:2.1-onbuild。
ONBUILD指令在创建专门用于自动编译、检查等操作的基础镜像时,十分有用。
11. STOPSIGNAL
指定所创建镜像启动的容器接收退出的信号值:
STOPSIGNAL signal
12. HEALTHCHECK
配置所启动容器如何进行健康检查(如何判断健康与否),自Dockers1.12开始支持。格式有两种:
HEALTHCHECK [OPTIONS] CMD command
:根据所执行命令返回值是否为0来判断;HEALTHCHECK NONE
:禁止基础镜像中的健康检查。
OPTIONS支持如下参数:
-interval=DURATION (default 30s)
:过多久检查一次;-timeout=DURATION (default 30s)
:每次检查等待结果的超时;-retries=N (default : 3)
:如果失败了,重试几次才最终确定失败。
13. SHELL
指定其他命令使用shell时的默认shell类型:
SHELL ["executable", "parameters"]
默认值为["/bin/sh", "-c"]
。
注意:对于Windows系统,Shell路径中使用了""作为分隔符,建议在Dockerfile开头添加# escape='来指定转义符。
2.2 操作指令
1. RUN
运行指定命令。
格式为RUN <command>
或RUN ["executable", "param1", "param2"]
。注意后者指令会被解析为JSON数组,因此必须用双引号。前者默认将在shell终端中运行命令,即/bin/sh -c
;后者则使用exec执行,不会启动shell环境。
指定使用其他终端类型可以通过第二种方式实现,例如RUN ["/bin/bash", "-c", "echo hello"]
。
每条RUN指令将在当前镜像基础上执行指定命令,并提交为新的镜像层。当命令较长时,可以使用\来换行,例如:
RUN apt-get update \
&& apt-get install -y libsnappy-dev zliglg-dev libbz2-dev \
&& rm -rf /var/cache/apt \
&& rm -rf /var/lib/apt/lists/*
2. CMD
CMD指令用来指定容器启动时默认执行的命令。支持三种格式:
CDM ["executable", "param1", "param2"]
:相当于执行exectuable param1 param2
,推荐方式;CMD command param1 param2
:在默许的shell中执行,提供给需要交互的应用;CMD ["param1", "param2"]
:提供给ENTRYPOINT的默认参数。
每个Dockerfile只能由一条CMD命令。如果指定了多条命令,只有最后一条会被执行。
如果每个用户启动容器的时候手动指定了运行的命令(作为run命令的参数),则会覆盖掉CMD指定的命令。
3. ADD
添加内容到镜像。格式为ADD <src> <dest>
。
该命令将复制指定的<src>路径下的内容到容器的<dest>路径下。
其中<src>可以是Dockerfile所在目录的一个相对路径(文件或目录);也可以是一个URL;还可以是一个tar文件(自动解压为目录)。<dest>可以是镜像内绝对路径,或者相对于工作目录(WORKDIR)的相对路径。
路径支持正则格式,例如:ADD *.c /code/
4. COPY
复制内容到镜像。格式为COPY <src> <dest>
。
复制本地主机的<src>(为Dockerfile所在目录的相对路径,文件或目录)下内容到镜像中的<dest>。目标路径不存在时,会自动创建。
路径同样支持正则格式。
COPY与ADD功能类似,当使用本地目录为源目录时,推荐使用COPY。
三、创建镜像
编写完成Dockerfile之后,可以通过docker [image] build
命令来创建镜像。
基本的格式为docker build [OPTIONS] PATH | URL | -
.
该命令将读取指定路径下(包括子目录)的Dockerfile,并将该路径下所有数据作为上下文(Context)发送给Docker服务端。Docker服务端在校验Dockerfile格式通过后,逐条执行其中定义的指令,碰到ADD、COPY和RUN指令会生成一层新的镜像。最终如果创建镜像成功,会返回最终镜像的ID。
如果上下文过大,会导致发送大量数据给服务端,延缓创建过程。因此除非是生成镜像所必需的文件,不然不要放到上下文路径下。如果使用非上下文路径下的Dockerfile,可以通过-f选项来指定其路径。
要指定生成镜像的标签信息,可以通过-t选项。该选项可以重复使用多次为镜像一次添加多个名称。
例如,上下文路径为/tmp/docker_builder/,并且希望生成镜像标签为builder/first_image:1.0.0,可以使用下面的命令:
docker build -t builder/first_image:1.0.0 /tmp/docker_builder/
3.1 命令选项
docker [image] build
命令支持一系列的选项,可以调整创建镜像过程的行为:
选项 | 说明 |
---|---|
-add-host list | 添加自定义的主机名到IP的映射 |
-build-arg list | 添加创建时的变量 |
-cache-from strings | 使用指定镜像作为缓存源 |
-cgroup-parent string | 继承上层的cgroup |
-compress | 使用gzip来压缩创建上下文数据 |
-cpu-period int | 分配的CFS调度器时长 |
-cpu-quota int | CFS调度器总份额 |
-c, -cpu-shares int | CPU权重 |
-cpuset-cpus string | 多CPU允许使用的CPU |
-cpuset-mems string | 多CPU允许使用的内存 |
-disable-content-trust | 不进行镜像校验,默认为true |
-f, -file string | Dockerfile的名称 |
-force-rm | 总是删除中间过程的容器 |
-iidfile string | 将镜像ID写入到文件 |
-isolation string | 容器的隔离机制 |
-label list | 配置镜像的元数据 |
-m, -memory bytes | 限制使用内存量 |
-memory-swap bytes | 限制内存和缓存的总量 |
-network string | 指定RUN命令时的网络模式 |
-no-cache | 创建镜像时不适用缓存 |
-platform string | 指定平台类型 |
-pull | 总是尝试获取镜像的最新版本 |
-q, -quiet | 不打印创建过程中的日志信息 |
-rm | 创建成功后自动删除中间过程容器,默认为真 |
-security-opt strings | 指定安全相关选项 |
-shm-size bytes | /dev/shm的大小 |
-squash | 将创建的多层挤压放入到一层中 |
-stream | 持续获取创建的上下文 |
-t, -tag list | 指定镜像的标签列表 |
-target string | 指定创建的目标阶段 |
-ulimit ulimit | 指定ulimit的配置 |
3.2 指定父镜像
用户可以选择两种镜像来作为父镜像,一种是所谓的基础镜像(baseimage),另外一种是普通的镜像(往往由第三方创建,基于基础镜像)。
基础镜像比较特殊,其Dockerfile下往往不存在FROM指令,或者基于scratch镜像(FROM scratch),这意味着其在整个镜像树中处于根的位置。
下面的Dockerfile定义了一个简单的基础镜像,将用户提前编译好的二进制可执行文件binary复制到镜像中,运行容器时执行binary命令:
FROM scratch
ADD binary /
CMD ["/binary"]
普通的镜像也可以作为父镜像来使用,包括常见的busybox、debian、ubuntu等。
3.3 使用.dockerignore文件
可以通过.dockerignore文件(每一行添加一条匹配模式)来让Docker忽略匹配路径或文件,在创建镜像的时候不允许将无关数据发送到服务端。
例如下面的例子中包括了6行忽略的模式(第一行为注释):
# .dockerignore文件中可以定义忽略模式
*/temp*
*/*/temp*
tmp?
_*
Dockerfile
!README.md
dockerignore文件中模式语法支持Golang风格的路径正则格式:
1. "*"表示任意多个字符;
2. "?"代表单个字符;
3. "!"表示不匹配(即不忽略指定的路径或文件)
3.4 多步骤创建
对于需要编译的应用(如C、Go或Java语言等)来说,通常情况下至少需要准备两个环境的Docker镜像:
- 编译环境镜像:包括完整的编译引擎、依赖库等,往往比较庞大。作用是编译应用为二进制文件。
- 运行环境镜像:利用编译好的二进制文件,运行应用,由于不需要编译环境,体积比较小。
使用多步骤创建,可以在保证最终生成的运行环境镜像保持精简的情况下,使用单一的Dockerfile,降低维护复杂度。
以Go语言为例。创建干净目录,进入到目录中,创建main.go文件,内容为:
// main.go will output "Hello, Docker"
package main
import(
"fmt"
)
func main(){
fmt.Println("Hello, Docker")
}
创建Dockerfile,使用golang:1.9镜像编译应用二进制文件为app,使用精简的镜像alpine:latest作为运行环境。Dockerfile的完整内容为:
FROM golang:1.9 as builder # define stage name as builder
RUN mkdir -p /go/src/test
WORKDIR /go/src/test
COPY main.go
RUN CGO_ENABLED=0 GOOS=linux go build -o app .
FROM alpine:latest
RUN apk --no-cache add ca-certificates
WORKDIR /root/
COPY --from=builder /go/src/test/app . # copy file from the builder stage
CMD ["./app"]
执行如下命令创建镜像,并运行应用:
docker build -t yeasy/test-multistage:latest .
docker run --rm yeasy/test-multistage:latest