k8s pod详解

目录

pod

pod基本介绍

k8s集群中pod两种使用方式

pause容器使得Pod中所有容器共享两种资源:网络和存储

kubernetes中的pause容器主要为每个容器提供以下功能

k8s设计这样的pod概念和特殊组成结构有什么用意

pod分类

pod容器的分类

基础容器(infrastructure container)

初始化容器(initcontainers)

应用容器(Maincontainer)

镜像拉取策略(image PullPolicy)

重启策略(restartPolicy)

资源限制

Pod 和 容器 的资源请求和限制

CPU 资源单位

内存 资源单位 

健康检查:又称为探针(Probe) 

探针的三种规则

Probe支持三种检查方法

pod状态

Container生命周期


pod

pod基本介绍

Pod是kubernetes中最小的资源管理组件,Pod也是最小化运行容器化应用的资源对象。一个Pod代表着集群中运行的一个进程。kubernetes中其他大多数组件都是围绕着Pod来进行支撑和扩展Pod功能的,例如,用于管理Pod运行的StatefulSet和Deployment等控制器对象,用于暴露Pod应用的Service和Ingress对象,为Pod提供存储的PersistentVolume存储资源对象等

k8s集群中pod两种使用方式

一个Pod中运行一个容器

“每个Pod中一个容器”的模式是最常见的用法;在这种使用方式中,你可以把Pod想象成是单个容器的封装,kuberentes管理的是Pod而不是直接管理容器。

在一个Pod中同时运行多个容器

一个Pod中也可以同时封装几个需要紧密耦合互相协作的容器,它们之间共享资源。这些在同一个Pod中的容器可以互相协作成为一个service单位,比如一个容器共享文件,另一个“sidecar”容器来更新这些文件。Pod将这些容器的存储资源作为一个实体来管理

一个Pod下的容器必须运行于同一节点上。现代容器技术建议一个容器只运行一个进程,该进程在容器中PID命令空间中的进程号为1,可直接接收并处理信号,进程终止时容器生命周期也就结束了。若想在容器内运行多个进程,需要有一个类似Linux操作系统init进程的管控类进程,以树状结构完成多进程的生命周期管理。运行于各自容器内的进程无法直接完成网络通信,这是由于容器间的隔离机制导致,k8s中的Pod资源抽象正是解决此类问题,Pod对象是一组容器的集合,这些容器共享Network、UTS及IPC命令空间,因此具有相同的域名、主机名和网络接口,并可通过IPC直接通信。

Pod资源中针对各容器提供网络命令空间等共享机制的是底层基础容器pause (也可称为父容器)。pause就是为了管理Pod容器间的共享操作,这个父容器需要能够准确地知道如何去创建共享运行环境的容器,还能管理这些容器的生命周期。为了实现这个父容器的构想,kubernetes中,用pause容器来作为一个Pod中所有容器的父容器。这个pause容器有两个核心的功能,一是它提供整个Pod的Linux命名空间的基础。二来启用PID命名空间,它在每个Pod中都作为PID为1进程(init进程),并回收僵尸进程。

pause容器使得Pod中所有容器共享两种资源:网络和存储

网络
每个Pod都会被分配一个唯一的IP地址。Pod中的所有容器共享网络空间,包括IP地址和端口。Pod内部的容器可以使用localhost互相通信。Pod中的容器与外界通信时,必须分配共享网络资源(例如使用宿主机的端口映射)。

存储
Pod可以指定多个共享的Volume。Pod中的所有容器都可以访问共享的Volume。Volume也可以用来持久化Pod中的存储资源,以防容器重启后文件丢失。

每个pod都有一个特殊的被称为”基础容器“的pause容器,pause容器对应的镜像属于k8s平台的一部分,处理pause容器,每个pod还包含一个或多个紧密相关的用户应用容器

kubernetes中的pause容器主要为每个容器提供以下功能

在pod中担任linux命名空间(如网络命名空间)共享的基础

启用pid命名空间,开启init进程

协助他的容器生命周期

提供健康检查和生存探针

k8s设计这样的pod概念和特殊组成结构有什么用意

在一组容器作为一个单元的情况下,难以对整体的容器简单地进行判断及有效地进行行动。比如,一个容器死亡了 那么引入与业务无关的Pause容器作为Pod的基础容器,以它的状态代表着整个容器组的状态,这样就可以解决该问题

Pod里的多个应用容器共享Pause容器的IP,共享Pause容器挂载的Volume,这样简化了应用容器之间的通信问题,也解决了容器之间的文件共享问题

pod分类

自主式pod

这种Pod本身是不能自我修复的,当Pod被创建后(不论是由你直接创建还是被其他Controller),都会被Kuberentes调度到集群的Node上。直到Pod的进程终止、被删掉、因为缺少资源而被驱逐、或者Node故障之前这个Pod都会一直保持在那个Node上。Pod不会自愈。如果Pod运行的Node故障,或者是调度器本身故障,这个Pod就会被删除。同样的,如果Pod所在Node缺少资源或者Pod处于维护状态,Pod也会被驱逐

控制器管理的pod

Kubernetes使用更高级的称为Controller的抽象层,来管理Pod实例。Controller可以创建和管理多个Pod,提供副本管理、滚动升级和集群级别的自愈能力。例如,如果一个Node故障,Controller就能自动将该节点上的Pod调度到其他健康的Node上。虽然可以直接使用Pod,但是在Kubernetes中通常是使用Controller来管理Pod的

pod容器的分类

基础容器(infrastructure container)

基础容器维护整个pod网络和存储空间,每次创建pod的时候会创建,运行的每一个pod都有一个 pause-amd64 的基础容器自动会运行,对于用户是透明的

#创建一个自主式的pod,在对应的node节点查看
kubectl run nginx --image=nginx 

kubectl get pod -owide
NAME    READY   STATUS    RESTARTS   AGE   IP            NODE     NOMINATED NODE   READINESS GATES
nginx   1/1     Running   0          86s   10.244.1.52   node01   <none>           <none>

#对应节点查看
CONTAINER ID   IMAGE                  COMMAND                   CREATED         STATUS         PORTS     NAMES
abad514a5b53   nginx                  "/docker-entrypoint.…"   3 minutes ago   Up 3 minutes             k8s_nginx_nginx_default_4a2b568c-1e4d-481c-a236-0dc7b5e96ed1_0
79ae20dbfdba   k8s.gcr.io/pause:3.2   "/pause"                  4 minutes ago   Up 4 minutes             k8s_POD_nginx_default_4a2b568c-1e4d-481c-a236-0dc7b5e96ed1_0

初始化容器(initcontainers)

Init容器必须在应用程序容器启动之前运行完成,而应用程序容器是并行运行的,所以Init容器能够提供了一种简单的阻塞或延迟应用容器的启动的方法

Init 容器与普通的容器非常像,除了以下两点:

Init 容器总是运行到成功完成为止

每个 Init 容器都必须在下一个 Init 容器启动之前成功完成启动和退出

如果 Pod 的 Init 容器失败,k8s 会不断地重启该 Pod,直到 Init 容器成功为止。然而,如果 Pod 对应的重启策略(restartPolicy)为 Never,它不会重新启动

Init 的容器作用

因为init容器具有与应用容器分离的单独镜像,其启动相关代码具有如下优势

Init 容器可以包含一些安装过程中应用容器中不存在的实用工具或个性化代码。例如,没有必要仅为了在安装过程中使用类似 sed、 awk、 python 或 dig 这样的工具而去FROM 一个镜像来生成一个新的镜像

Init 容器可以安全地运行这些工具,避免这些工具导致应用镜像的安全性降低

应用镜像的创建者和部署者可以各自独立工作,而没有必要联合构建一个单独的应用镜像

Init 容器能以不同于Pod内应用容器的文件系统视图运行。因此,Init容器可具有访问 Secrets 的权限,而应用容器不能够访问

由于 Init 容器必须在应用容器启动之前运行完成,因此 Init 容器提供了一种机制来阻塞或延迟应用容器的启动

直到满足了一组先决条件。一旦前置条件满足,Pod内的所有的应用容器会并行启动

cd /mnt

vim test1.yaml
apiVersion: v1
kind: Pod
metadata:
  name: myapp-pod
  labels:
    app: myapp
spec:
  containers:
  - name: myapp-container
    image: busybox:1.28
    command: ['sh', '-c', 'echo The app is running! &&  sleep 3600 ']
  initContainers:
  - name: init-myservice
    image: busybox:1.28
    command: ['sh', '-c', 'until nslookup myservice; do echo waiting for myservice; sleep 2; done;']
  - name: init-mydb
    image: busybox:1.28
    command: ['sh', '-c', 'until nslookup mydb; do echo waiting for mydb; sleep 2; done;']

#这个例子是定义了一个具有 2 个 Init 容器的简单 Pod。 第一个等待 myservice 启动, 第二个等待 mydb 启动。 一旦这两个 Init容器都启动完成,Pod 将启动 spec 中的应用容器。
========================================================================================
特别说明:
●在Pod启动过程中,Init容器会按顺序在网络和数据卷初始化之后启动。每个容器必须在下一个容器启动之前成功退出。
●如果由于运行时或失败退出,将导致容器启动失败,它会根据Pod的restartPolicy指定的策略进行重试。然而,如果Pod的restartPolicy设置为Always,Init容器失败时会使用RestartPolicy策略。
●在所有的Init容器没有成功之前,Pod将不会变成Ready状态。Init容器的端口将不会在Service中进行聚集。正在初始化中的Pod处于Pending状态,但应该会将Initializing状态设置为true。
●如果Pod重启,所有Init容器必须重新执行。
●对Init容器spec的修改被限制在容器image字段,修改其他字段都不会生效。更改Init容器的image字段,等价于重启该Pod。
●Init容器具有应用容器的所有字段。除了readinessProbe,因为Init容器无法定义不同于完成(completion)的就绪(readiness)之外的其他状态。这会在验证过程中强制执行。
●在Pod中的每个app和Init容器的名称必须唯一;与任何其它容器共享同一个名称,会在验证时抛出错误。
=========================================================================================

#查看状态
kubectl get pod 
NAME        READY   STATUS     RESTARTS   AGE
myapp-pod   0/1     Init:0/2   0          3m47s
nginx       1/1     Running    0          32m

#没有启动成功,查看具体信息
kubectl describe pod myapp-pod

...

Events:
  Type    Reason     Age    From               Message
  ----    ------     ----   ----               -------
  Normal  Scheduled  5m44s  default-scheduler  Successfully assigned default/myapp-pod to node02
  Normal  Pulling    5m43s  kubelet            Pulling image "busybox:1.28"
  Normal  Pulled     5m26s  kubelet            Successfully pulled image "busybox:1.28" in 17.339782474s
  Normal  Created    5m26s  kubelet            Created container init-myservice
  Normal  Started    5m26s  kubelet            Started container init-myservice

#无法创建init-myservice,查看日志获取详细信息
kubectl logs my-service -c init-myservice

...

waiting for myservice
nslookup: can't resolve 'myservice'
nslookup: can't resolve 'myservice'
Server:    10.96.0.10
Address 1: 10.96.0.10 kube-dns.kube-system.svc.cluster.local

waiting for myservice
Server:    10.96.0.10
Address 1: 10.96.0.10 kube-dns.kube-system.svc.cluster.local

waiting for myservice
nslookup: can't resolve 'myservice'

#找不到myservice域名,无法跳出循环

#编写myservice的service的yaml文件
vim myservice.yaml

apiVersion: v1
kind: Service
metadata:
  name: myservice
spec:
  ports:
  - protocol: TCP
    port: 80
    targetPort: 9376

kubectl get pod
kubectl get pod
NAME        READY   STATUS     RESTARTS   AGE
myapp-pod   0/1     Init:1/2   0          18m
nginx       1/1     Running    0          47m

#已经恢复一个,查看另一个的情况
kubectl describe pod myapp-db

...

Events:
  Type    Reason     Age   From               Message
  ----    ------     ----  ----               -------
  Normal  Scheduled  19m   default-scheduler  Successfully assigned default/myapp-pod to node02
  Normal  Pulling    19m   kubelet            Pulling image "busybox:1.28"
  Normal  Pulled     19m   kubelet            Successfully pulled image "busybox:1.28" in 17.339782474s
  Normal  Created    19m   kubelet            Created container init-myservice
  Normal  Started    19m   kubelet            Started container init-myservice
  Normal  Pulled     76s   kubelet            Container image "busybox:1.28" already present on machine
  Normal  Created    76s   kubelet            Created container init-mydb
  Normal  Started    76s   kubelet            Started container init-mydb

#查看日志
kubectl logs myapp-db -c init-mydb

...

waiting for mydb
nslookup: can't resolve 'mydb'
nslookup: can't resolve 'mydb'
Server:    10.96.0.10
Address 1: 10.96.0.10 kube-dns.kube-system.svc.cluster.local

waiting for mydb
Server:    10.96.0.10
Address 1: 10.96.0.10 kube-dns.kube-system.svc.cluster.local

nslookup: can't resolve 'mydb'
waiting for mydb

#同样的,创建mydb的service对应的yaml文件

vim mydb.yaml

apiVersion: v1
kind: Service
metadata:
  name: mydb
spec:
  ports:
  - protocol: TCP
    port: 80
    targetPort: 9377


kubectl apply -f mydb.yaml


kubectl get pod
NAME        READY   STATUS    RESTARTS   AGE
myapp-pod   1/1     Running   0          84m
nginx       1/1     Running   0          113m


应用容器(Maincontainer)

应用容器会在init容器完成并退出后并行启动

镜像拉取策略(image PullPolicy)

Pod 的核心是运行容器,必须指定容器引擎,比如 Docker,启动容器时,需要拉取镜像,k8s 的镜像拉取策略可以由用户指定

IfNotPresent

在镜像已经存在的情况下,kubelet 将不再去拉取镜像,仅当本地缺失时才从仓库中拉取,默认的镜像拉取策略

Always 

每次创建 Pod 都会重新拉取一次镜像

Never 

Pod 不会主动拉取这个镜像,仅使用本地镜像

注意  对于标签为“:latest”的镜像文件,其默认的镜像获取策略即为“Always”;而对于其他标签的镜像,其默认策略则为“IfNotPresent”

vim test2.yaml

apiVersion: v1
kind: Pod
metadata:
  name: pod-test1
spec:
  containers:
    - name: nginx
      image: nginx
      imagePullPolicy: Always
      command: ["echo" , "SUCCESS"]

kubectl apply -f test2.yaml

kubectl get pods -o wide #此时 Pod 的状态异常,原因是 echo 执行完进程终止,容器生命周期也就结束

NAME        READY   STATUS             RESTARTS   AGE    IP            NODE     NOMINATED NODE   READINESS GATES
myapp-pod   1/1     Running            0          98m    10.244.2.37   node02   <none>           <none>
nginx       1/1     Running            0          126m   10.244.1.52   node01   <none>           <none>
pod-test1   0/1     CrashLoopBackOff   1          41s    10.244.2.38   node02   <none>           <none>

kubectl describe pod pod-test1
#可以发现 Pod 中的容器在生命周期结束后,由于 Pod 的重启策略为 Always,容器再次重启了,并且又重新开始拉取镜像
...

Events:
  Type     Reason     Age                 From               Message
  ----     ------     ----                ----               -------
  Normal   Scheduled  2m3s                default-scheduler  Successfully assigned default/pod-test1 to node02
  Normal   Pulled     107s                kubelet            Successfully pulled image "nginx" in 15.734730617s
  Normal   Pulled     91s                 kubelet            Successfully pulled image "nginx" in 15.675328748s
  Normal   Pulled     62s                 kubelet            Successfully pulled image "nginx" in 15.607262669s
  Normal   Pulling    36s (x4 over 2m3s)  kubelet            Pulling image "nginx"
  Normal   Created    21s (x4 over 107s)  kubelet            Created container nginx
  Normal   Pulled     21s                 kubelet            Successfully pulled image "nginx" in 15.577490682s
  Normal   Started    20s (x4 over 107s)  kubelet            Started container nginx
  Warning  BackOff    4s (x6 over 90s)    kubelet            Back-off restarting failed container

#修改 test2.yaml文件
vim test2.yaml

apiVersion: v1
kind: Pod
metadata:
  name: pod-test1
spec:
  containers:
    - name: nginx
      image: nginx:1.14							#修改 nginx 镜像版本
      imagePullPolicy: Always
      #command: [ "echo", "SUCCESS" ]			#删除

#删除原有的资源
kubectl delete -f test2.yaml 


#更新资源
kubectl apply -f test2.yaml 


#查看 Pod 状态
kubectl get pods -o wide
NAME        READY   STATUS    RESTARTS   AGE    IP            NODE     NOMINATED NODE   READINESS GATES
myapp-pod   1/1     Running   0          104m   10.244.2.37   node02   <none>           <none>
nginx       1/1     Running   0          133m   10.244.1.52   node01   <none>           <none>
pod-test1   1/1     Running   0          66s    10.244.2.39   node02   <none>           <none>

#在任意 node 节点上使用 curl 查看头部信息

curl -I 10.244.2.39

HTTP/1.1 200 OK
Server: nginx/1.14.2
Date: Mon, 27 May 2024 11:47:16 GMT
Content-Type: text/html
Content-Length: 612
Last-Modified: Tue, 04 Dec 2018 14:44:49 GMT
Connection: keep-alive
ETag: "5c0692e1-264"
Accept-Ranges: bytes




重启策略(restartPolicy)

当 Pod 中的容器退出时通过节点上的 kubelet 重启容器。适用于 Pod 中的所有容器。

Always

当容器终止退出后,总是重启容器,默认策略

OnFailure

当容器异常退出(退出状态码非0)时,重启容器;正常退出则不重启容器

Never

当容器终止退出,从不重启容器。

注意  K8S 中不支持重启 Pod 资源,只有删除重建

vim test3.yaml

apiVerson: v1
kind: Pod
metadata:
  name: foo
spec:
  containers:
  - name: busybox
    image: busybox
    args:
    - /bin/sh
    - -c
    - sleep 30 ; exit 3

kubectl apply -f test3.yaml

#查看Pod状态,等容器启动后30秒后执行exit退出进程进入error状态,就会重启次数加1
kubectl get pod
NAME        READY   STATUS    RESTARTS   AGE
foo         0/1     Error     0          53s
myapp-pod   1/1     Running   0          117m
nginx       1/1     Running   0          146m
pod-test1   1/1     Running   0          13m
[root@master01 mnt]#kubectl get pod 
NAME        READY   STATUS    RESTARTS   AGE
foo         1/1     Running   1          78s
myapp-pod   1/1     Running   0          117m
nginx       1/1     Running   0          146m
pod-test1   1/1     Running   0          14m



kubectl  delete -f  test3.yaml

对test3.yaml进行修改

apiVersion: v1
kind: Pod
metadata:
  name: foo
spec:
  containers:
  - name: busybox
    image: busybox
    args:
    - /bin/sh
    - -c
    - sleep 30; exit 3
  restartPolicy: Never  #添加该内容  注意:跟container同一个级别

kubectl apply -f test3.yaml


容器进入error状态不会进行重启
kubectl get pod -w 

NAME        READY   STATUS    RESTARTS   AGE
foo         1/1     Running   0          2s
myapp-pod   1/1     Running   0          126m
nginx       1/1     Running   0          154m
pod-test1   1/1     Running   0          22m
foo         0/1     Error     0          33s

资源限制

当定义 Pod 时可以选择性地为每个容器设定所需要的资源数量。 最常见的可设定资源是 CPU 和内存大小,以及其他类型的资源

当为 Pod 中的容器指定了 request 资源时,调度器就使用该信息来决定将 Pod 调度到哪个节点上。当还为容器指定了 limit 资源时,kubelet 就会确保运行的容器不会使用超出所设的 limit 资源量。kubelet 还会为容器预留所设的 request 资源量, 供该容器使用

如果 Pod 运行所在的节点具有足够的可用资源,容器可以使用超出所设置的 request 资源量。不过,容器不可以使用超出所设置的 limit 资源量

如果给容器设置了内存的 limit 值,但未设置内存的 request 值,Kubernetes 会自动为其设置与内存 limit 相匹配的 request 值。 类似的,如果给容器设置了 CPU 的 limit 值但未设置 CPU 的 request 值,则 Kubernetes 自动为其设置 CPU 的 request 值 并使之与 CPU 的 limit 值匹配

Pod 和 容器 的资源请求和限制

spec.containers[].resources.requests.cpu        定义创建容器时预分配的CPU资源
spec.containers[].resources.requests.memory        定义创建容器时预分配的内存资源
spec.containers[].resources.limits.cpu            定义 cpu 的资源上限 
spec.containers[].resources.limits.memory        定义内存的资源上限

CPU 资源单位

CPU 资源的 request 和 limit 以 cpu 为单位。Kubernetes 中的一个 cpu 相当于1个 vCPU(1个超线程)

Kubernetes 也支持带小数 CPU 的请求。spec.containers[].resources.requests.cpu 为 0.5 的容器能够获得一个 cpu 的  、一半 CPU 资源(类似于Cgroup对CPU资源的时间分片)。表达式 0.1 等价于表达式 100m(毫核),表示每 1000 毫秒内容器可以使用的 CPU 时间总量为 0.1*1000 毫秒

Kubernetes 不允许设置精度小于 1m 的 CPU 资源

内存 资源单位 

内存的 request 和 limit 以字节为单位。可以以整数表示,或者以10为底数的指数的单位(E、P、T、G、M、K)来表示, 或者以2为底数的指数的单位(Ei、Pi、Ti、Gi、Mi、Ki)来表示。
如:1KB=10^3=1000,1MB=10^6=1000000=1000KB,1GB=10^9=1000000000=1000MB
1KiB=2^10=1024,1MiB=2^20=1048576=1024KiB

apiVersion: v1
kind: Pod
metadata:
  name: frontend
spec:
  containers:
  - name: app
    image: images.my-company.example/app:v4
    env:
    - name: MYSQL_ROOT_PASSWORD
      value: "password"
    resources:
      requests:
        memory: "64Mi"
        cpu: "250m"
      limits:
        memory: "128Mi"
        cpu: "500m"
  - name: log-aggregator
    image: images.my-company.example/log-aggregator:v6
    resources:
      requests:
        memory: "64Mi"
        cpu: "250m"
      limits:
        memory: "128Mi"
        cpu: "500m"

#此例子中的 Pod 有两个容器。每个容器的 request 值为 0.25 cpu 和 64MiB 内存,每个容器的 limit 值为 0.5 cpu 和 128MiB 内存。那么可以认为该 Pod 的总的资源 request 为 0.5 cpu 和 128 MiB 内存,总的资源 limit 为 1 cpu 和 256MiB 内存。


vim test4.yaml

apiVersion: v1
kind: Pod
metadata:
  name: frontend
spec:
  containers:
  - name: web
    image: nginx
    env:
    - name: WEB_ROOT_PASSWORD
      value: "password"
    resources:
      requests:
        memory: "64Mi"
        cpu: "250m"
      limits:
        memory: "128Mi"
        cpu: "500m"
  - name: db
    image: mysql
    env:
    - name: MYSQL_ROOT_PASSWORD
      value: "abc123"
    resources:
      requests:
        memory: "128Mi"
        cpu: "0.5"
      limits:
        memory: "256Mi"
        cpu: "1"

kubectl apply -f test5.yaml

kubectl describe pod frontend
...

web:
    Container ID:   docker://8ecf144751da4110f4dd5e67f7598ec4a6d38b345e9a79c8468ecb0f1cfb564f
    Image:          nginx
    Image ID:       docker-pullable://nginx@sha256:0d17b565c37bcbd895e9d92315a05c1c3c9a29f762b011a10c54a66cd53c9b31
    Port:           <none>
    Host Port:      <none>
    State:          Running
      Started:      Mon, 27 May 2024 21:14:59 +0800
    Ready:          True
    Restart Count:  0
    Limits:
      cpu:     500m
      memory:  128Mi
    Requests:
      cpu:     250m
      memory:  64Mi
    Environment:
      WEB_ROOT_PASSWORD:  password
    Mounts:
      /var/run/secrets/kubernetes.io/serviceaccount from default-token-kr2xl (ro)
  db:
    Container ID:   docker://1155ff3a8bd64c460dc728a0bc9136bcf069edd5bf828ddd90d58342bf03ab57
    Image:          mysql
    Image ID:       docker-pullable://mysql@sha256:e9027fe4d91c0153429607251656806cc784e914937271037f7738bd5b8e7709
    Port:           <none>
    Host Port:      <none>
    State:          Running
      Started:      Mon, 27 May 2024 21:15:16 +0800
    Ready:          True
    Restart Count:  0
    Limits:
      cpu:     1
      memory:  1Gi
    Requests:
      cpu:     500m
      memory:  512Mi

...

kubectl get pods -o wide 
NAME       READY   STATUS    RESTARTS   AGE     IP            NODE     NOMINATED NODE   READINESS GATES
frontend   2/2     Running   0          3m59s   10.244.1.57   node01   <none>           <none>

kubectl get nodes node01

...
Non-terminated Pods:          (3 in total)
  Namespace                   Name                     CPU Requests  CPU Limits   Memory Requests  Memory Limits  AGE
  ---------                   ----                     ------------  ----------   ---------------  -------------  ---
  default                     frontend                 750m (37%)    1500m (75%)  576Mi (33%)      1152Mi (66%)   5m20s
  kube-flannel                kube-flannel-ds-vq46g    100m (5%)     0 (0%)       50Mi (2%)        0 (0%)         11d
  kube-system                 kube-proxy-qztsc         0 (0%)        0 (0%)       0 (0%)           0 (0%)         11d
Allocated resources:
  (Total limits may be over 100 percent, i.e., overcommitted.)
  Resource           Requests     Limits
  --------           --------     ------
  cpu                850m (42%)   1500m (75%)
  memory             626Mi (36%)  1152Mi (66%)
  ephemeral-storage  0 (0%)       0 (0%)
  hugepages-1Gi      0 (0%)       0 (0%)
  hugepages-2Mi      0 (0%)       0 (0%)
Events:              <none>


健康检查:又称为探针(Probe) 

探针是由kubelet对容器执行的定期诊断

探针的三种规则

livenessProbe   判断容器是否正在运行。如果探测失败,则kubelet会杀死容器,并且容器将根据 restartPolicy 来设置 Pod 状态。 如果容器不提供存活探针,则默认状态为Success。

readinessProbe   判断容器是否准备好接受请求。如果探测失败,端点控制器将从与 Pod 匹配的所有 service 址endpoints 中剔除删除该Pod的IP地。 初始延迟之前的就绪状态默认为Failure。如果容器不提供就绪探针,则默认状态为Success。

startupProbe(这个1.17版本增加的)  判断容器内的应用程序是否已启动,主要针对于不能确定具体启动时间的应用。如果配置了 startupProbe 探测,在则在 startupProbe 状态为 Success 之前,其他所有探针都处于无效状态,直到它成功后其他探针才起作用。 如果 startupProbe 失败,kubelet 将杀死容器,容器将根据 restartPolicy 来重启。如果容器没有配置 startupProbe, 则默认状态为 Success

注意:以上规则可以同时定义。在readinessProbe检测成功之前,Pod的running状态是不会变成ready状态的

Probe支持三种检查方法

exec  在容器内执行指定命令。如果命令退出时返回码为0则认为诊断成功

tcpSocket   对指定端口上的容器的IP地址进行TCP检查(三次握手)。如果端口打开,则诊断被认为是成功的

httpGet  对指定的端口和路径上的容器的IP地址执行HTTPGet请求。如果响应的状态码大于等于200且小于400,则诊断被认为是成功的

每次探测都将获得以下三种结果之一
成功  容器通过了诊断。
失败  容器未通过诊断。
未知  诊断失败,因此不会采取任何行动

apiVersion: v1
kind: Pod
metadata:
  labels:
    test: liveness
  name: liveness-exec
spec:
  containers:
  - name: liveness
    image: k8s.gcr.io/busybox
    args:
    - /bin/sh
    - -c
    - touch /tmp/healthy; sleep 30; rm -rf /tmp/healthy; sleep 60;
    livenessProde:
      exec:
        command:
        - cat
        - /tmp/healthy
      failureThreshold: 1
      initialDelaySeconds: 5
      periodSeconds: 5

#initialDelaySeconds:指定 kubelet 在执行第一次探测前应该等待5秒,即第一次探测是在容器启动后的第6秒才开始执行。默认是 0 秒,最小值是 0
#periodSeconds:指定了 kubelet 应该每 5 秒执行一次存活探测。默认是 10 秒。最小值是 1。
#failureThreshold: 当探测失败时,Kubernetes 将在放弃之前重试的次数。 存活探测情况下的放弃就意味着重新启动容器。就绪探测情况下的放弃 Pod 会被打上未就绪的标签。默认值是 3。最小值是 1。
#timeoutSeconds:探测的超时后等待多少秒。默认值是 1 秒。最小值是 1。(在 Kubernetes 1.20 版本之前,exec 探针会忽略 timeoutSeconds 探针会无限期地 持续运行,甚至可能超过所配置的限期,直到返回结果为止。)

可以看到 Pod 中只有一个容器。kubelet 在执行第一次探测前需要等待 5 秒,kubelet 会每 5 秒执行一次存活探测。kubelet 在容器内执行命令 cat /tmp/healthy 来进行探测。如果命令执行成功并且返回值为 0,kubelet 就会认为这个容器是健康存活的。 当到达第 31 秒时,这个命令返回非 0 值,kubelet 会杀死这个容器并重新启动它

#exec方式测试

vim test5.yaml

apiVersion: v1
kind: Pod
metadata:
  name: liveness-exec
  namespace: default
spec:
  containers:
  - name: liveness-exec-container
    image: busybox
    imagePullPolicy: IfNotPresent
    command: ["/bin/sh" , "-c" , "touch /tmp/live"; sleep 30; rm -rf /tmp/live; sleep 60;]
    livenessProbe:
      exec:
        command: ["test","-e","/tmp/live"]
      initialDelaySeconds: 1
      periodSeconds: 3

kubectl apply -f  test5.yaml

kubectl describe pods liveness-exec

...

Events:
  Type     Reason     Age                  From               Message
  ----     ------     ----                 ----               -------
  Normal   Scheduled  2m56s                default-scheduler  Successfully assigned default/liveness-exec to node02
  Normal   Pulling    2m56s                kubelet            Pulling image "busybox"
  Normal   Pulled     2m38s                kubelet            Successfully pulled image "busybox" in 17.889125702s
  Warning  Unhealthy  51s (x6 over 2m6s)   kubelet            Liveness probe failed:
  Normal   Killing    51s (x2 over 2m)     kubelet            Container liveness-exec-container failed liveness probe, will be restarted
  Normal   Created    21s (x3 over 2m38s)  kubelet            Created container liveness-exec-container
  Normal   Started    21s (x3 over 2m38s)  kubelet            Started container liveness-exec-container
  Normal   Pulled     21s (x2 over 90s)    kubelet            Container image "busybox" already present on machine


kubectl get pods -w  #当检测失败时,便会重启
NAME            READY   STATUS    RESTARTS   AGE
frontend        2/2     Running   0          37m
liveness-exec   1/1     Running   0          26s
liveness-exec   1/1     Running   1          88s
liveness-exec   1/1     Running   2          2m37s



httpGet方式测试

apiVersion: v1
kind: Pod
metadata:
  labels:
    test: liveness
  name: liveness-http
spec:
  containers:
  - name: liveness
    image: k8s.gcr.io/liveness
    args:
    - /server
    livenessProde:
      httpGet:
        path: /healthz
        port: 8080
        httpHeaders:
        - name: Custom-Header
          value: Awsome
        initialDelaySeconds: 3
        periodSeconds: 3

#在这个配置文件中,可以看到 Pod 也只有一个容器。initialDelaySeconds 字段告诉 kubelet 在执行第一次探测前应该等待 3 秒。periodSeconds 字段指定了 kubelet 每隔 3 秒执行一次存活探测。kubelet 会向容器内运行的服务(服务会监听 8080 端口)发送一个 HTTP GET 请求来执行探测。如果服务器上 /healthz 路径下的处理程序返回成功代码,则 kubelet 认为容器是健康存活的。如果处理程序返回失败代码,则 kubelet 会杀死这个容器并且重新启动它


vim test6.yaml
apiVersion: v1
kind: Pod
metadata:
  name: liveness-httpget
  namespace: default
spec:
  containers:
  - name: liveness-httpget-container
    image: soscscs/myapp:v1
    imagePullPolicy: IfNotPresent
    ports:
    - name: http
      containerPort: 80
    livenessProbe:
      httpGet:
        port: http
        path: /index.html
      initialDelaySeconds: 1
      periodSeconds: 3
      timeoutSeconds: 10
	  
kubectl apply -f test6.yaml

kubectl exec -it liveness-httpget -- rm -rf /usr/share/nginx/html/index.html

kubectl get pods
NAME               READY   STATUS    RESTARTS   AGE
liveness-httpget   1/1     Running   1          2m44s


tcpSocket方式测试

apiVersion: v1
kind: Pod
metadata:
  name: goproxy
  labels:
    app: goproxy
spec:
  containers:
  - name: goproxy
    image: k8s.gcr.io/goproxy:0.1
    ports:
    - containerPort: 8080
    readinessProbe:
      tcpSocket:
        port: 8080
      initialDelaySeconds: 5
      periodSeconds: 10
    livenessProbe:
      tcpSocket:
        port: 8080
      initialDelaySeconds: 15
      periodSeconds: 20

这个例子同时使用 readinessProbe 和 livenessProbe 探测。kubelet 会在容器启动 5 秒后发送第一个 readinessProbe 探测。这会尝试连接 goproxy 容器的 8080 端口。如果探测成功,kubelet 将继续每隔 10 秒运行一次检测。除了 readinessProbe 探测,这个配置包括了一个 livenessProbe 探测。kubelet 会在容器启动 15 秒后进行第一次 livenessProbe 探测。就像 readinessProbe 探测一样,会尝试连接 goproxy 容器的 8080 端口。如果 livenessProbe 探测失败,这个容器会被重新启动。

vim test7.yaml
apiVersion: v1
kind: Pod
metadata:
  name: probe-tcp
spec:
  containers:
  - name: nginx
    image: soscscs/myapp:v1
    livenessProbe:
      initialDelaySeconds: 5
      timeoutSeconds: 1
      tcpSocket:
        port: 8080
      periodSeconds: 10
      failureThreshold: 2

kubectl apply -f tcpsocket.yaml

kubectl exec -it probe-tcp  -- netstat -natp
Active Internet connections (servers and established)
Proto Recv-Q Send-Q Local Address           Foreign Address         State       PID/Program name    
tcp        0      0 0.0.0.0:80              0.0.0.0:*               LISTEN      1/nginx: master pro

kubectl get pods -w
NAME        READY   STATUS    RESTARTS   AGE
probe-tcp   1/1     Running             0          1s
probe-tcp   1/1     Running             1          25s       #第一次是 init(5秒) + period(10秒) * 2
probe-tcp   1/1     Running             2          45s       #第二次是 period(10秒) + period(10秒)  重试了两次
probe-tcp   1/1     Running             3          65s


就绪检测

vim test8.yaml

apiVersion: v1
kind: Pod
metadata:
  name: readiness-httpget
  namespace: default
spec:
  containers:
  - name: readiness-httpget-container
    image: soscscs/myapp:v1
    imagePullPolicy: IfNotPresent
    ports:
    - name: http
      containerPort: 80
    readinessProbe:
      httpGet:
        port: 80
        path: /index1.html
      initialDelaySeconds: 1
      periodSeconds: 3
    livenessProbe:
      httpGet:
        port: http
        path: /index.html
      initialDelaySeconds: 1
      periodSeconds: 3
      timeoutSeconds: 10

kubectl apply -f test8.yaml



kubectl get pods #readiness探测失败,无法进入READY状态
NAME                READY   STATUS    RESTARTS   AGE
readiness-httpget   0/1     Running   0          18s

kubectl exec -it readiness-httpget sh
 # cd /usr/share/nginx/html/
 # ls
50x.html    index.html
 # echo 123 > index1.html 
 # exit

kubectl get pods 
NAME                READY   STATUS    RESTARTS   AGE
readiness-httpget   1/1     Running   0          2m31s

kubectl exec -it readiness-httpget -- rm -rf /usr/share/nginx/html/index.html

kubectl get pods -w
NAME                READY   STATUS    RESTARTS   AGE
readiness-httpget   1/1     Running   0          4m10s
readiness-httpget   0/1     Running   1          4m15s

就绪检测2

vim test9.yaml

apiVersion: v1
kind: Pod
metadata:
  name: myapp1
  labels:
     app: myapp
spec:
  containers:
  - name: myapp
    image: soscscs/myapp:v1
    ports:
    - name: http
      containerPort: 80
    readinessProbe:
      httpGet:
        port: 80
        path: /index.html
      initialDelaySeconds: 5
      periodSeconds: 5
      timeoutSeconds: 10 
---
apiVersion: v1
kind: Pod
metadata:
  name: myapp2
  labels:
     app: myapp
spec:
  containers:
  - name: myapp
    image: soscscs/myapp:v1
    ports:
    - name: http
      containerPort: 80
    readinessProbe:
      httpGet:
        port: 80
        path: /index.html
      initialDelaySeconds: 5
      periodSeconds: 5
      timeoutSeconds: 10 
---
apiVersion: v1
kind: Pod
metadata:
  name: myapp3
  labels:
     app: myapp
spec:
  containers:
  - name: myapp
    image: soscscs/myapp:v1
    ports:
    - name: http
      containerPort: 80
    readinessProbe:
      httpGet:
        port: 80
        path: /index.html
      initialDelaySeconds: 5
      periodSeconds: 5
      timeoutSeconds: 10 
---
apiVersion: v1
kind: Service
metadata:
  name: myapp
spec:
  selector:
    app: myapp
  type: ClusterIP
  ports:
  - name: http
    port: 80
    targetPort: 80

kubectl apply -f test9.yaml

kubectl get pods,svc,endpoints -o wide
NAME                    READY   STATUS    RESTARTS   AGE   IP            NODE     NOMINATED NODE   READINESS GATES
pod/myapp1              1/1     Running   0          29s   10.244.2.44   node02   <none>           <none>
pod/myapp2              1/1     Running   0          29s   10.244.2.43   node02   <none>           <none>
pod/myapp3              1/1     Running   0          29s   10.244.1.62   node01   <none>           <none>
pod/readiness-httpget   0/1     Running   1          14m   10.244.1.61   node01   <none>           <none>

NAME                 TYPE        CLUSTER-IP      EXTERNAL-IP   PORT(S)   AGE     SELECTOR
service/kubernetes   ClusterIP   10.96.0.1       <none>        443/TCP   11d     <none>
service/myapp        ClusterIP   10.96.106.147   <none>        80/TCP    29s     app=myapp
service/mydb         ClusterIP   10.96.134.191   <none>        80/TCP    4h32m   <none>
service/myservice    ClusterIP   10.96.47.106    <none>        80/TCP    5h37m   <none>

NAME                   ENDPOINTS                                      AGE
endpoints/kubernetes   192.168.111.7:6443                             11d
endpoints/myapp        10.244.1.62:80,10.244.2.43:80,10.244.2.44:80   28s


kubectl exec -it pod/myapp1 -- rm -rf /usr/share/nginx/html/index.html
readiness探测失败,Pod 无法进入READY状态,且端点控制器将从 endpoints 中剔除删除该 Pod 的 IP 地址

kubectl get pods,svc,endpoints -o wide

NAME                    READY   STATUS    RESTARTS   AGE   IP            NODE     NOMINATED NODE   READINESS GATES
pod/myapp1              1/1     Running   0          97s   10.244.2.44   node02   <none>           <none>
pod/myapp2              1/1     Running   0          97s   10.244.2.43   node02   <none>           <none>
pod/myapp3              1/1     Running   0          97s   10.244.1.62   node01   <none>           <none>
pod/readiness-httpget   0/1     Running   1          15m   10.244.1.61   node01   <none>           <none>

NAME                 TYPE        CLUSTER-IP      EXTERNAL-IP   PORT(S)   AGE     SELECTOR
service/kubernetes   ClusterIP   10.96.0.1       <none>        443/TCP   11d     <none>
service/myapp        ClusterIP   10.96.106.147   <none>        80/TCP    97s     app=myapp
service/mydb         ClusterIP   10.96.134.191   <none>        80/TCP    4h33m   <none>
service/myservice    ClusterIP   10.96.47.106    <none>        80/TCP    5h38m   <none>

NAME                   ENDPOINTS                                      AGE
endpoints/kubernetes   192.168.111.7:6443                             11d
endpoints/myapp        10.244.1.62:80,10.244.2.43:80,10.244.2.44:80   96s



启动、退出动作
vim test10.yaml

apiVersion: v1
kind: Pod
metadata:
  name: lifecycle-demo
spec:
  containers:
  - name: lifecycle-demo-container
    image: soscscs/myapp:v1
    lifecycle:   #此为关键字段
      postStart:
        exec:
          command: ["/bin/sh", "-c", "echo Hello from the postStart handler >> /var/log/nginx/message"]      
      preStop:
        exec:
          command: ["/bin/sh", "-c", "echo Hello from the poststop handler >> /var/log/nginx/message"]
    volumeMounts:
    - name: message-log
      mountPath: /var/log/nginx/
      readOnly: false
  initContainers:
  - name: init-myservice
    image: soscscs/myapp:v1
    command: ["/bin/sh", "-c", "echo 'Hello initContainers'   >> /var/log/nginx/message"]
    volumeMounts:
    - name: message-log
      mountPath: /var/log/nginx/
      readOnly: false
  volumes:
  - name: message-log
    hostPath:
      path: /data/volumes/nginx/log/
      type: DirectoryOrCreate


kubectl apply -f test10.yaml

kubectl get pods -owide

kubectl exec -it lifecycle-demo -- cat /var/log/nginx/message

Hello initContainers
Hello from the postStart handler


在node02上查看
cat /data/volumes/nginx/log/message 


Hello initContainers
Hello from the postStart handler


#由上可知,init Container先执行,然后当一个主容器启动后,Kubernetes 将立即发送 postStart 事件。

#删除 pod 后,再在 node02 节点上查看
kubectl delete pod lifecycle-demo

#在node02上查看

cat /data/volumes/nginx/log/message 
Hello initContainers
Hello from the postStart handler
Hello from the poststop handler

#由上可知,当在容器被终结之前, Kubernetes 将发送一个 preStop 事件。

pod状态

pending  pod已经被系统认可了,但是内部的container还没有创建出来。这里包含调度到node上的时间以及下载镜像的时间,会持续一小段时间

Running  pod已经与node绑定了(调度成功),而且pod中所有的container已经创建出来,至少有一个容器在运行中,或者容器的进程正在启动或者重启状态。--这里需要注意pod虽然已经Running了,但是内部的container不一定完全可用。因此需要进一步检测container的状态

Succeeded  这个状态很少出现,表明pod中的所有container已经成功的terminated了,而且不会再被拉起了

Failed  pod中的所有容器都被terminated,至少一个container是非正常终止的。(退出的时候返回了一个非0的值或者是被系统直接终止)

unknown  由于某些原因pod的状态获取不到,有可能是由于通信问题。 一般情况下pod最常见的就是前两种状态。而且当Running的时候,需要进一步关注container的状态

Container生命周期

Waiting  启动到运行中间的一个等待状态。

Running  运行状态。

Terminated  终止状态。 如果没有任何异常的情况下,container应该会从Waiting状态变为Running状态,这时容器可用

但如果长时间处于Waiting状态,container会有一个字段reason表明它所处的状态和原因,如果这个原因很容易能标识这个容器再也无法启动起来时,例如ContainerCannotRun,整个服务启动就会迅速返回

  • 24
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值