k8s学习 — （实践）第四章资源调度

西木Qi

已于 2024-01-03 15:25:18 修改

阅读量1.4k

点赞数 21

分类专栏： k8s 文章标签： kubernetes

于 2023-12-25 06:00:00 首次发布

本文链接：https://blog.csdn.net/Mr_XiMu/article/details/135178811

版权

k8s 专栏收录该内容

19 篇文章 4 订阅

订阅专栏

k8s学习 — （实践）第四章资源调度

※ 各章节重要知识点
1 Label 和 Selector
2 Deployment
3 StatefulSet
4 DaemonSet
书签
5 HPA 自动扩 / 缩容

※ 各章节重要知识点

k8s学习 — 各章节重要知识点

1 Label 和 Selector

1.1 标签（Label）

1.1.1 配置文件（方式）

在各类资源的 metadata.labels 中进行配置。

1.1.2 kubectl（方式）

临时创建 label

kubectl label po <pod名称> app=hello

修改已经存在的标签

kubectl label po <pod名称> app=hello2 --overwrite

查看 label

# selector 按照 label 单值查找节点
kubectl get po -A -l app=hello

# 查看所有节点的 labels
kubectl get po --show-labels

1.2 选择器（Selector）

1.2.1 配置文件（方式）

在各对象的配置 spec.selector 或其他可以写 selector 的属性中编写。

1.2.2 kubectl（方式）

# 匹配单个值，查找 app=hello 的 pod
kubectl get po -A -l app=hello

# 匹配多个值
kubectl get po -A -l 'k8s-app in (metrics-server, kubernetes-dashboard)'
或 

# 查找 version!=1 and app=nginx 的 pod 信息
kubectl get po -l version!=1,app=nginx

# 不等值 + 语句
kubectl get po -A -l version!=1,'app in (busybox, nginx)'

2 Deployment

# 先在 /opt/k8s/ 创建 deployments 文件夹
cd /opt/k8s/deployments
# 然后再操作2.1.1 创建 到2.1.5 暂停与恢复的练习

注意：只有2.1.1 创建这一步是创建 Deployment，2.1.2~2.1.5 都是对已创建的Deployment中的配置进行相关操作！！！

2.1 创建

均在/opt/k8s/deployments下操作。

创建一个 Deployment（后面有6. 根据配置文件创建 Deployment）

kubectl create deploy nginx-deploy --image=nginx:1.7.9
# 或执行
kubectl create -f xxx.yaml
# 或执行
kubectl create -f xxx.yaml --record

–record 会在 annotation 中记录当前命令创建或升级了资源，后续可以查看做过哪些变动操作。

注意：–record 在后续版本中将被去除（Flag --record has been deprecated, --record will be removed in the future）

# 执行结果
[root@k8s-master deployments]# kubectl create deploy nginx-deploy --image=nginx:1.7.9
deployment.apps/nginx-deploy created

查看部署信息

kubectl get deployments
# 或执行
kubectl get deploy

[root@k8s-master deployments]# kubectl get deploy
NAME           READY   UP-TO-DATE   AVAILABLE   AGE
nginx-deploy   1/1     1            1           102s

查看 Deployment 关联的 ReplicaSet

kubectl get replicaset
# 或执行
kubectl get rs

[root@k8s-master deployments]# kubectl get rs
NAME                      DESIRED   CURRENT   READY   AGE
nginx-deploy-78d8bf4fd7   1         1         1       2m21s

查看 Deployment 关联的 ReplicaSet 进而关联的 Pod

kubectl get po

[root@k8s-master deployments]# kubectl get po
NAME                            READY   STATUS    RESTARTS   AGE
nginx-deploy-78d8bf4fd7-tl5lv   1/1     Running   0          4m1s

查看 Pod 以及展示标签，可以看到是关联的那个 rs（ReplicaSet）

kubectl get pods --show-labels

[root@k8s-master deployments]# kubectl get pods --show-labels
NAME                            READY   STATUS    RESTARTS   AGE     LABELS
nginx-deploy-78d8bf4fd7-tl5lv   1/1     Running   0          4m54s   app=nginx-deploy,pod-template-hash=78d8bf4fd7

注意：通过2~4步操作，观察它们的名称前缀，可以发现 Deployment 和 ReplicaSet 以及 Pod 之间是具有关联性。

查看已创建的 Deployment 配置文件（yaml格式）

kubectl get deploy nginx-deploy -o yaml

[root@k8s-master deployments]# kubectl get deploy nginx-deploy -o yaml
apiVersion: apps/v1
kind: Deployment
metadata:
  annotations:
    deployment.kubernetes.io/revision: "1"
  creationTimestamp: "2023-12-29T00:35:09Z"
  generation: 1
  labels:
    app: nginx-deploy
  name: nginx-deploy
  namespace: default
  resourceVersion: "56069"
  uid: 5d1a493a-339d-4893-a468-badad8f7f083
spec:
  progressDeadlineSeconds: 600
  replicas: 1
  revisionHistoryLimit: 10
  selector:
    matchLabels:
      app: nginx-deploy
  strategy:
    rollingUpdate:
      maxSurge: 25%
      maxUnavailable: 25%
    type: RollingUpdate
  template:
    metadata:
      creationTimestamp: null
      labels:
        app: nginx-deploy
    spec:
      containers:
      - image: nginx:1.7.9
        imagePullPolicy: IfNotPresent
        name: nginx
        resources: {}
        terminationMessagePath: /dev/termination-log
        terminationMessagePolicy: File
      dnsPolicy: ClusterFirst
      restartPolicy: Always
      schedulerName: default-scheduler
      securityContext: {}
      terminationGracePeriodSeconds: 30
status:
  availableReplicas: 1
  conditions:
  - lastTransitionTime: "2023-12-29T00:35:10Z"
    lastUpdateTime: "2023-12-29T00:35:10Z"
    message: Deployment has minimum availability.
    reason: MinimumReplicasAvailable
    status: "True"
    type: Available
  - lastTransitionTime: "2023-12-29T00:35:09Z"
    lastUpdateTime: "2023-12-29T00:35:10Z"
    message: ReplicaSet "nginx-deploy-78d8bf4fd7" has successfully progressed.
    reason: NewReplicaSetAvailable
    status: "True"
    type: Progressing
  observedGeneration: 1
  readyReplicas: 1
  replicas: 1
  updatedReplicas: 1

实际可用部分（去除status相关的）

apiVersion: apps/v1
kind: Deployment
metadata:
  annotations:
    deployment.kubernetes.io/revision: "1"
  creationTimestamp: "2023-12-29T00:35:09Z"
  generation: 1
  labels:
    app: nginx-deploy
  name: nginx-deploy
  namespace: default
  resourceVersion: "56069"
  uid: 5d1a493a-339d-4893-a468-badad8f7f083
spec:
  progressDeadlineSeconds: 600
  replicas: 1
  revisionHistoryLimit: 10
  selector:
    matchLabels:
      app: nginx-deploy
  strategy:
    rollingUpdate:
      maxSurge: 25%
      maxUnavailable: 25%
    type: RollingUpdate
  template:
    metadata:
      creationTimestamp: null
      labels:
        app: nginx-deploy
    spec:
      containers:
      - image: nginx:1.7.9
        imagePullPolicy: IfNotPresent
        name: nginx
        resources: {}
        terminationMessagePath: /dev/termination-log
        terminationMessagePolicy: File
      dnsPolicy: ClusterFirst
      restartPolicy: Always
      schedulerName: default-scheduler
      securityContext: {}
      terminationGracePeriodSeconds: 30

根据配置文件创建 Deployment
在/opt/k8s/deployments下创建 nginx-deploy.yaml （和实际可用部分相比，进一步去除了一些不需要的配置，将期望副本数改为3）

apiVersion: apps/v1 # deployment api 版本
kind: Deployment # 资源类型为 deployment
metadata: # 元信息
  labels: # 标签
    app: nginx-deploy # 具体的 key: value 配置形式
  name: nginx-deploy # deployment 的名字
  namespace: default # 所在的命名空间
spec:
  replicas: 3 # 期望副本数
  revisionHistoryLimit: 10 # 进行滚动更新后，保留的历史版本数
  selector: # 选择器，用于找到匹配的 RS
    matchLabels: # 按照标签匹配
      app: nginx-deploy # 匹配的标签key/value
  strategy: # 更新策略
    rollingUpdate: # 滚动更新配置
      maxSurge: 25% # 进行滚动更新时，更新的个数最多可以超过期望副本数的个数/比例
      maxUnavailable: 25% # 进行滚动更新时，最大不可用比例更新比例，表示在所有副本数中，最多可以有多少个不更新成功
    type: RollingUpdate # 更新类型，采用滚动更新
  template: # pod 模板
    metadata: # pod 的元信息
      labels: # pod 的标签
        app: nginx-deploy
    spec: # pod 期望信息
      containers: # pod 的容器
      - image: nginx:1.7.9 # 镜像
        imagePullPolicy: IfNotPresent # 拉取策略
        name: nginx # 容器名称
      restartPolicy: Always # 重启策略
      terminationGracePeriodSeconds: 30 # 删除操作最多宽限多长时间

yaml配置文件中粘贴内容格式混乱的解决办法：

# 1 按esc键

# 2 输入 :set paste

# 3 按 o（字母）然后粘贴内容

删除已有的名称为 nginx-deploy 的 Deployment

kubectl delete deploy nginx-deploy

[root@k8s-master deployments]# kubectl delete deploy nginx-deploy
deployment.apps "nginx-deploy" deleted

根据配置文件创建 nginx-deploy

kubectl create -f nginx-deploy.yaml

[root@k8s-master deployments]# kubectl create -f nginx-deploy.yaml
deployment.apps/nginx-deploy created

[root@k8s-master deployments]# kubectl get deploy
NAME           READY   UP-TO-DATE   AVAILABLE   AGE
nginx-deploy   3/3     3            3           59s

[root@k8s-master deployments]# kubectl get rs
NAME                      DESIRED   CURRENT   READY   AGE
nginx-deploy-78d8bf4fd7   3         3         3       69s

[root@k8s-master deployments]# kubectl get pods --show-labels
NAME                            READY   STATUS    RESTARTS   AGE   LABELS
nginx-deploy-78d8bf4fd7-kxwpd   1/1     Running   0          75s   app=nginx-deploy,pod-template-hash=78d8bf4fd7
nginx-deploy-78d8bf4fd7-smbwp   1/1     Running   0          75s   app=nginx-deploy,pod-template-hash=78d8bf4fd7
nginx-deploy-78d8bf4fd7-zcwzr   1/1     Running   0          75s   app=nginx-deploy,pod-template-hash=78d8bf4fd7

2.2 滚动更新

只有修改了 Deployment 配置文件中的 template 中的属性后，才会触发更新操作。

修改非template 中的属性或者是/opt/k8s/deployments/nginx-deploy.yaml都不行。

可以先把/opt/k8s/deployments/nginx-deploy.yaml的副本数改为3个，重新创建应用，便于后续观察滚动更新过程。

以修改 nginx 镜像版本号为例：（将镜像版本号改为1.9.1）

修改单个属性：

kubectl set image deployment/nginx-deploy（deploy名称） nginx=nginx:1.9.1

修改多个属性：

kubectl edit deploy nginx-deploy（deploy名称）

查看滚动更新的过程：

kubectl get deploy --show-labels

kubectl rollout status deploy <deployment_name>

[root@k8s-master deployments]# kubectl get deploy --show-labels
NAME           READY   UP-TO-DATE   AVAILABLE   AGE   LABELS
nginx-deploy   3/3     1            3           20m   app=nginx-deploy
[root@k8s-master deployments]# kubectl get deploy --show-labels
NAME           READY   UP-TO-DATE   AVAILABLE   AGE   LABELS
nginx-deploy   3/3     1            3           20m   app=nginx-deploy
[root@k8s-master deployments]# kubectl get deploy --show-labels
NAME           READY   UP-TO-DATE   AVAILABLE   AGE   LABELS
nginx-deploy   3/3     1            3           20m   app=nginx-deploy
[root@k8s-master deployments]# kubectl get deploy --show-labels
NAME           READY   UP-TO-DATE   AVAILABLE   AGE   LABELS
nginx-deploy   3/3     2            3           20m   app=nginx-deploy
[root@k8s-master deployments]# kubectl get deploy --show-labels
NAME           READY   UP-TO-DATE   AVAILABLE   AGE   LABELS
nginx-deploy   3/3     2            3           20m   app=nginx-deploy

#（滚动更新中）......

[root@k8s-master deployments]# kubectl get deploy --show-labels
NAME           READY   UP-TO-DATE   AVAILABLE   AGE   LABELS
nginx-deploy   3/3     3            3           38m   app=nginx-deploy
# 更新完成

[root@k8s-master deployments]# kubectl rollout status deploy nginx-deploy
Waiting for deployment "nginx-deploy" rollout to finish: 2 out of 3 new replicas have been updated...

#（滚动更新中）......

[root@k8s-master deployments]# kubectl rollout status deploy nginx-deploy
deployment "nginx-deploy" successfully rolled out
# 更新完成

查看部署描述，最后展示发生的事件列表也可以看到滚动更新过程。（末尾有更新过程讲解）

kubectl describe deploy <deployment_name>

[root@k8s-master deployments]# kubectl describe deploy nginx-deploy
Name:                   nginx-deploy
Namespace:              default
CreationTimestamp:      Fri, 29 Dec 2023 16:03:13 +0800
Labels:                 app=nginx-deploy
Annotations:            deployment.kubernetes.io/revision: 3
Selector:               app=nginx-deploy
Replicas:               3 desired | 3 updated | 3 total | 3 available | 0 unavailable
StrategyType:           RollingUpdate
MinReadySeconds:        0
RollingUpdateStrategy:  25% max unavailable, 25% max surge
Pod Template:
  Labels:  app=nginx-deploy
  Containers:
   nginx:
    Image:        nginx:1.7.9
    Port:         <none>
    Host Port:    <none>
    Environment:  <none>
    Mounts:       <none>
  Volumes:        <none>
Conditions:
  Type           Status  Reason
  ----           ------  ------
  Available      True    MinimumReplicasAvailable
  Progressing    True    NewReplicaSetAvailable
OldReplicaSets:  <none>
NewReplicaSet:   nginx-deploy-78d8bf4fd7 (3/3 replicas created)
Events:
  Type    Reason             Age                 From                   Message
  ----    ------             ----                ----                   -------
  Normal  ScalingReplicaSet  23m                 deployment-controller  Scaled up replica set nginx-deploy-754898b577 to 1
  Normal  ScalingReplicaSet  23m                 deployment-controller  Scaled down replica set nginx-deploy-78d8bf4fd7 to 2
  Normal  ScalingReplicaSet  23m                 deployment-controller  Scaled up replica set nginx-deploy-754898b577 to 2
  Normal  ScalingReplicaSet  12m                 deployment-controller  Scaled down replica set nginx-deploy-78d8bf4fd7 to 1
  Normal  ScalingReplicaSet  12m                 deployment-controller  Scaled up replica set nginx-deploy-754898b577 to 3
  Normal  ScalingReplicaSet  12m                 deployment-controller  Scaled down replica set nginx-deploy-78d8bf4fd7 to 0

# Events的更新过程
# 1. 先启动 1 个新的rs（nginx-deploy-754898b577），此时有 1 个新的rs
# 2. 下线 2 个旧的rs（nginx-deploy-78d8bf4fd7），此时已下线 2 个旧的rs
# 3. 启动 1 个新的rs（nginx-deploy-754898b577），此时有 2 个新的rs
# 4. 下线 1 个旧的rs（nginx-deploy-78d8bf4fd7），此时已下线 3 个旧的rs
# 5. 启动 1 个新的rs（nginx-deploy-754898b577），此时有 3 个新的rs
# 6. 下线 0 个旧的rs（nginx-deploy-78d8bf4fd7），此时已下线 3 个旧的rs

通过 kubectl get deployments 获取部署信息，UP-TO-DATE 表示已经有多少副本达到了配置中要求的数目。

通过 kubectl get rs 可以看到增加了一个新的 rs。

[root@k8s-master deployments]# kubectl get rs --show-labels
NAME                      DESIRED   CURRENT   READY   AGE   LABELS
nginx-deploy-754898b577   0         0         0       37m   app=nginx-deploy,pod-template-hash=754898b577
nginx-deploy-78d8bf4fd7   3         3         3       57m   app=nginx-deploy,pod-template-hash=78d8bf4fd7

通过 kubectl get pods 可以看到所有 pod 关联的 rs 变成了新的。

多个滚动更新并行

假设当前有 5 个 nginx:1.7.9 版本，你想将版本更新为 1.9.1。

当更新成功了三个为 1.9.1 以后，你马上又将期望更新的版本改为 1.9.2。

那么此时会立马删除已更新的三个（1.9.1），并且立马开启更新为 1.9.2 的任务，也就是直接跳过继续更新（1.9.1），直接进行 1.9.2 的任务。

2.3 回滚

有时候你可能想回退一个 Deployment，例如，当 Deployment 不稳定时，比如一直 crash looping。

默认情况下，kubernetes 会在系统中保存前两次的 Deployment 的 rollout 历史记录，以便你可以随时回退（你可以修改 revision history limit 来更改保存的 revision 数）。

案例：
更新 Deployment 时参数不小心写错，如 nginx:1.9.1 写成了 nginx:1.91

kubectl set image deployment/nginx-deploy nginx=nginx:1.91

[root@k8s-master deployments]# kubectl set image deployment/nginx-deploy nginx=nginx:1.91
deployment.apps/nginx-deploy image updated

监控滚动升级状态，由于镜像名称错误，下载镜像失败，因此更新过程会卡住

kubectl rollout status deployments nginx-deploy

[root@k8s-master deployments]# kubectl rollout status deployments nginx-deploy
Waiting for deployment "nginx-deploy" rollout to finish: 1 out of 3 new replicas have been updated...

结束监听后，获取 rs 信息，我们可以看到新增的 rs 副本数是 1 个

kubectl get rs

[root@k8s-master deployments]# kubectl get rs
NAME                      DESIRED   CURRENT   READY   AGE
nginx-deploy-754898b577   0         0         0       49m
nginx-deploy-78d8bf4fd7   3         3         3       70m
nginx-deploy-f7f5656c7    1         1         0       44s

通过 kubectl get pods 获取 pods 信息，我们可以看到关联到新的 rs 的 pod，状态处于 ImagePullBackOff 状态。

[root@k8s-master deployments]# kubectl get pods
NAME                            READY   STATUS             RESTARTS   AGE
nginx-deploy-78d8bf4fd7-25rmq   1/1     Running            0          28m
nginx-deploy-78d8bf4fd7-mq6kc   1/1     Running            0          28m
nginx-deploy-78d8bf4fd7-vxcpv   1/1     Running            0          28m
nginx-deploy-f7f5656c7-xfpq5    0/1     ImagePullBackOff   0          105s

为了修复这个问题，我们需要找到需要回退的 revision 进行回退。
通过 kubectl rollout history deployment/nginx-deploy 可以获取 revison 的列表。

[root@k8s-master deployments]# kubectl rollout history deployment/nginx-deploy
deployment.apps/nginx-deploy
REVISION  CHANGE-CAUSE
2         <none>
3         <none>
4         <none>

通过 kubectl rollout history deployment/nginx-deploy --revision=REVISION（版本号） 可以查看详细信息。

[root@k8s-master deployments]# kubectl rollout history deployment/nginx-deploy --revision=4
deployment.apps/nginx-deploy with revision #4
Pod Template:
  Labels:       app=nginx-deploy
        pod-template-hash=f7f5656c7
  Containers:
   nginx:
    Image:      nginx:1.91
    Port:       <none>
    Host Port:  <none>
    Environment:        <none>
    Mounts:     <none>
  Volumes:      <none>

[root@k8s-master deployments]# kubectl rollout history deployment/nginx-deploy --revision=3
deployment.apps/nginx-deploy with revision #3
Pod Template:
  Labels:       app=nginx-deploy
        pod-template-hash=78d8bf4fd7
  Containers:
   nginx:
    Image:      nginx:1.7.9
    Port:       <none>
    Host Port:  <none>
    Environment:        <none>
    Mounts:     <none>
  Volumes:      <none>

[root@k8s-master deployments]# kubectl rollout history deployment/nginx-deploy --revision=2
deployment.apps/nginx-deploy with revision #2
Pod Template:
  Labels:       app=nginx-deploy
        pod-template-hash=754898b577
  Containers:
   nginx:
    Image:      nginx:1.9.1
    Port:       <none>
    Host Port:  <none>
    Environment:        <none>
    Mounts:     <none>
  Volumes:      <none>

确认要回退的版本后，可以通过 kubectl rollout undo deployment/nginx-deploy 可以回退到上一个版本。

[root@k8s-master deployments]# kubectl rollout undo deployment/nginx-deploy
deployment.apps/nginx-deploy rolled back

也可以回退到指定的 revision：

kubectl rollout undo deployment/nginx-deploy --to-revision=2

[root@k8s-master deployments]# kubectl rollout undo deployment/nginx-deploy --to-revision=2
deployment.apps/nginx-deploy rolled back

再次通过 kubectl get deployment 和 kubectl describe deployment 可以看到，我们的版本已经回退到对应的 revison 上了。

可以通过在/opt/k8s/deployments/nginx-deploy.yaml中设置 .spec.revisonHistoryLimit 来指定 Deployment 保留多少 revison，如果设置为 0，则不允许 Deployment 回退了。

2.4 扩容 / 缩容

只有修改 Deployment 配置文件中的配置，才会触发扩容 / 缩容操作。

修改/opt/k8s/deployments/nginx-deploy.yaml不行。

扩容 / 缩容只是改变 Pod 数，没有更新 pod template 因此不会创建新的 rs。

# 1 命令行方式
kubectl scale --replicas=6 deploy nginx-deploy

kubectl scale --replicas=6 deploy（扩容的类型） nginx-deploy（名称）

# 2 修改配置文件方式
kubectl edit deploy nginx-deploy
# 然后 修改 replicas

[root@k8s-master deployments]# kubectl get deployment
NAME           READY   UP-TO-DATE   AVAILABLE   AGE
nginx-deploy   3/3     3            3           101m

[root@k8s-master deployments]# kubectl scale --replicas=6 deploy nginx-deploy
deployment.apps/nginx-deploy scaled

[root@k8s-master deployments]# kubectl get deployment
NAME           READY   UP-TO-DATE   AVAILABLE   AGE
nginx-deploy   6/6     6            6           101m

[root@k8s-master deployments]# kubectl scale --replicas=6 deploy nginx-deploy
deployment.apps/nginx-deploy scaled
[root@k8s-master deployments]# kubectl get pods
NAME                            READY   STATUS    RESTARTS   AGE
nginx-deploy-754898b577-8ns26   1/1     Running   0          29m
nginx-deploy-754898b577-g9q9h   1/1     Running   0          29m
nginx-deploy-754898b577-ksfbw   1/1     Running   0          29m
nginx-deploy-754898b577-rwbxg   1/1     Running   0          2s
nginx-deploy-754898b577-xc88j   1/1     Running   0          2s
nginx-deploy-754898b577-xtmmc   1/1     Running   0          2s
[root@k8s-master deployments]# kubectl get rs
NAME                      DESIRED   CURRENT   READY   AGE
nginx-deploy-754898b577   6         6         6       85m
nginx-deploy-78d8bf4fd7   0         0         0       106m
nginx-deploy-f7f5656c7    0         0         0       37m

2.5 暂停（滚动更新）与恢复（滚动更新）

由于每次 pod template 中的配置发生修改后，都会触发更新 deployment 操作，如果短时间频繁修改配置，就会产生多次更新，而实际上只需要执行最后一次滚动更新即可。

当出现此类情况时就可以先暂停 deployment 的 rollout，直到下次主动恢复后才会继续进行滚动更新。

（未实践，仅记录暂停和恢复的命令）！！！

暂停滚动更新命令：

kubectl rollout pause deploy <name>

[root@k8s-master deployments]# kubectl rollout pause deploy nginx-deploy
deployment.apps/nginx-deploy paused

修改一些属性，如限制 nginx 容器的最大cpu为 0.2 核，最大内存为 128M，最小内存为 64M，最小 cpu 为 0.1 核。

kubectl set resources deploy <deploy_name> -c <container_name> --limits=cpu=200m,memory=128Mi --requests=cpu100m,memory=64Mi

通过格式化输出 kubectl get deploy <name> -o yaml，可以看到配置确实发生的修改，再通过 kubectl get po 可以看到 pod 没有被更新。

恢复滚动更新命令：

kubectl rollout resume deploy <name>

[root@k8s-master deployments]# kubectl rollout resume deploy nginx-deploy
deployment.apps/nginx-deploy resumed

恢复后，再次查看 rs 和 po 信息，可以看到就开始进行滚动更新操作了。

kubectl get rs
kubectl get po

2.6 配置文件（nginx）

apiVersion: apps/v1 # deployment api 版本
kind: Deployment # 资源类型为 deployment
metadata: # 元信息
  labels: # 标签
    app: nginx-deploy # 具体的 key: value 配置形式
  name: nginx-deploy # deployment 的名字
  namespace: default # 所在的命名空间
spec:
  replicas: 3 # 期望副本数
  revisionHistoryLimit: 10 # 进行滚动更新后，保留的历史版本数
  selector: # 选择器，用于找到匹配的 RS
    matchLabels: # 按照标签匹配
      app: nginx-deploy # 匹配的标签key/value
  strategy: # 更新策略
    rollingUpdate: # 滚动更新配置
      maxSurge: 25% # 进行滚动更新时，更新的个数最多可以超过期望副本数的个数/比例
      maxUnavailable: 25% # 进行滚动更新时，最大不可用比例更新比例，表示在所有副本数中，最多可以有多少个不更新成功
    type: RollingUpdate # 更新类型，采用滚动更新
  template: # pod 模板
    metadata: # pod 的元信息
      labels: # pod 的标签
        app: nginx-deploy
    spec: # pod 期望信息
      containers: # pod 的容器
      - image: nginx:1.7.9 # 镜像
        imagePullPolicy: IfNotPresent # 拉取策略
        name: nginx # 容器名称
      restartPolicy: Always # 重启策略
      terminationGracePeriodSeconds: 30 # 删除操作最多宽限多长时间

3 StatefulSet

3.1 创建

创建 StatefulSet 的文件夹

mkdir /opt/k8s/statefulset/

在/opt/k8s/statefulset/下编写配置文件web.yaml

---
apiVersion: v1
kind: Service
metadata:
  name: nginx
  labels:
    app: nginx
spec:
  ports:
  - port: 80
    name: web
  clusterIP: None
  selector:
    app: nginx
---
apiVersion: apps/v1
kind: StatefulSet # StatefulSet 类型的资源
metadata:
  name: web # StatefulSet 对象的名字
spec:
  serviceName: "nginx" # 使用哪个 service来管理 dns（这里使用nginx的service，因为在nginx的metadata的name是nginx）
  replicas: 2
  selector: # 选择器，用于找到匹配的 RS
    matchLabels: # 按照标签匹配
      app: nginx # 匹配的标签key/value
  template:
    metadata:
      labels:
        app: nginx
    spec:
      containers:
      - name: nginx
        image: nginx:1.7.9
        ports: # 容器内部要暴露的端口
        - containerPort: 80 # 容器内部具体要暴露的端口号
          name: web # 该端口号配置的名字

根据配置文件创建 StatefulSet 应用

kubectl create -f web.yaml

[root@k8s-master statefulset]# kubectl create -f web.yaml
service/nginx created
statefulset.apps/web created

查看创建的 Service 和 StatefulSet 应用

# 查看 service
kubectl get service nginx

[root@k8s-master statefulset]# kubectl get service nginx
NAME    TYPE        CLUSTER-IP   EXTERNAL-IP   PORT(S)   AGE
nginx   ClusterIP   None         <none>        80/TCP    7m49s

# 查看 statefulset => sts
kubectl get statefulset web

[root@k8s-master statefulset]# kubectl get statefulset web
NAME   READY   AGE
web    2/2     32s

查看创建的 pod

[root@k8s-master statefulset]#  kubectl get po
NAME                            READY   STATUS    RESTARTS   AGE
nginx-deploy-754898b577-8ns26   1/1     Running   0          5h14m
nginx-deploy-754898b577-g9q9h   1/1     Running   0          5h14m
nginx-deploy-754898b577-ksfbw   1/1     Running   0          5h14m
nginx-deploy-754898b577-rwbxg   1/1     Running   0          4h44m
nginx-deploy-754898b577-xc88j   1/1     Running   0          4h44m
nginx-deploy-754898b577-xtmmc   1/1     Running   0          4h44m
web-0                           1/1     Running   0          2m25s
web-1                           1/1     Running   0          2m23s

# 查看创建的 pod，这些 pod 是有序的
kubectl get pods -l app=nginx

[root@k8s-master statefulset]# kubectl get pods -l app=nginx
NAME    READY   STATUS    RESTARTS   AGE
web-0   1/1     Running   0          4m10s
web-1   1/1     Running   0          4m8s

测试服务是否可访问（查看这些 pod 的 dns）

# 运行一个新的 pod，基础镜像为 busybox 工具包，利用里面的 nslookup 可以看到 dns 信息
kubectl run -i --tty --image busybox:1.28.4 dns-test /bin/sh

nslookup web-0.nginx

[root@k8s-master statefulset]# kubectl run -i --tty --image busybox:1.28.4 dns-test /bin/sh
If you don't see a command prompt, try pressing enter.
/ # nslookup web-0.nginx
Server:    10.96.0.10
Address 1: 10.96.0.10 kube-dns.kube-system.svc.cluster.local

Name:      web-0.nginx
Address 1: 10.244.36.97 web-0.nginx.default.svc.cluster.local
/ #
/ # nslookup web-1.nginx
Server:    10.96.0.10
Address 1: 10.96.0.10 kube-dns.kube-system.svc.cluster.local

Name:      web-1.nginx
Address 1: 10.244.169.153 web-1.nginx.default.svc.cluster.local

3.2 扩容 / 缩容

只有修改了 StatefulSet 配置文件中的 replicas 的属性后，才会触发更新操作。

修改非 replicas 的属性或者是/opt/k8s/statefulset/web.yaml都不行。

3.2.1 扩容

通过命令方式：

kubectl scale statefulset web --replicas=5

通过修改配置文件方式：（修改spec.replicas的值）

kubectl edit statefulset web

扩容前后的数量变化：

[root@k8s-master ~]#  kubectl get sts
NAME   READY   AGE
web    2/2     22h

[root@k8s-master ~]# kubectl scale statefulset web --replicas=5
statefulset.apps/web scaled

[root@k8s-master ~]#  kubectl get sts
NAME   READY   AGE
web    5/5     22h

扩容的具体过程：（可以看到是按顺序创建了web-2、web-3、web-4）

[root@k8s-master ~]#  kubectl describe sts web
Name:               web
Namespace:          default
CreationTimestamp:  Fri, 29 Dec 2023 22:30:25 +0800
Selector:           app=nginx
Labels:             <none>
Annotations:        <none>
Replicas:           5 desired | 5 total
Update Strategy:    RollingUpdate
  Partition:        0
Pods Status:        5 Running / 0 Waiting / 0 Succeeded / 0 Failed
Pod Template:
  Labels:  app=nginx
  Containers:
   nginx:
    Image:        nginx:1.7.9
    Port:         80/TCP
    Host Port:    0/TCP
    Environment:  <none>
    Mounts:       <none>
  Volumes:        <none>
Volume Claims:    <none>
Events:
  Type    Reason            Age   From                    Message
  ----    ------            ----  ----                    -------
  Normal  SuccessfulCreate  107s  statefulset-controller  create Pod web-2 in StatefulSet web successful
  Normal  SuccessfulCreate  105s  statefulset-controller  create Pod web-3 in StatefulSet web successful
  Normal  SuccessfulCreate  103s  statefulset-controller  create Pod web-4 in StatefulSet web successful

3.2.2 缩容

方式与3.2.1 扩容一致，这里以缩容到2为例，查看具体变化。

kubectl scale statefulset web --replicas=2

缩容前后的数量变化：

[root@k8s-master ~]#  kubectl get sts
NAME   READY   AGE
web    5/5     22h

[root@k8s-master ~]# kubectl scale statefulset web --replicas=2
statefulset.apps/web scaled

[root@k8s-master ~]#  kubectl get sts
NAME   READY   AGE
web    3/2     22h
[root@k8s-master ~]#  kubectl get sts
NAME   READY   AGE
web    2/2     22h

缩容的具体过程：（可以看到是按顺序从后往前删除 web-4、web-4、web-3，最后只剩web-0和web-1两个 pod）

[root@k8s-master ~]#  kubectl describe sts web
Name:               web
Namespace:          default
CreationTimestamp:  Fri, 29 Dec 2023 22:30:25 +0800
Selector:           app=nginx
Labels:             <none>
Annotations:        <none>
Replicas:           2 desired | 2 total
Update Strategy:    RollingUpdate
  Partition:        0
Pods Status:        2 Running / 0 Waiting / 0 Succeeded / 0 Failed
Pod Template:
  Labels:  app=nginx
  Containers:
   nginx:
    Image:        nginx:1.7.9
    Port:         80/TCP
    Host Port:    0/TCP
    Environment:  <none>
    Mounts:       <none>
  Volumes:        <none>
Volume Claims:    <none>
Events:
  Type    Reason            Age   From                    Message
  ----    ------            ----  ----                    -------
  Normal  SuccessfulCreate  17m   statefulset-controller  create Pod web-2 in StatefulSet web successful
  Normal  SuccessfulCreate  17m   statefulset-controller  create Pod web-3 in StatefulSet web successful
  Normal  SuccessfulCreate  17m   statefulset-controller  create Pod web-4 in StatefulSet web successful
  Normal  SuccessfulDelete  12s   statefulset-controller  delete Pod web-4 in StatefulSet web successful
  Normal  SuccessfulDelete  10s   statefulset-controller  delete Pod web-3 in StatefulSet web successful
  Normal  SuccessfulDelete  9s    statefulset-controller  delete Pod web-2 in StatefulSet web successful

3.3 镜像更新

只有修改了 StatefulSet 配置文件中的 template 中的属性后，才会触发更新操作。

修改非 template 中的属性或者是 /opt/k8s/statefulset/web.yaml 都不行。

推荐通过修改配置文件方式：（在3.2.2 缩容操作后只剩web-0和web-1两个 pod，继续修改template中的image的值，从1.7.9改为1.9.1）

kubectl edit statefulset web

版本变化：

[root@k8s-master ~]# kubectl rollout history sts web
statefulset.apps/web
REVISION  CHANGE-CAUSE
1         <none>

[root@k8s-master ~]# kubectl rollout history sts web --revision=1
statefulset.apps/web with revision #1
Pod Template:
  Labels:       app=nginx
  Containers:
   nginx:
    Image:      nginx:1.7.9
    Port:       80/TCP
    Host Port:  0/TCP
    Environment:        <none>
    Mounts:     <none>
  Volumes:      <none>

[root@k8s-master ~]# kubectl edit sts web
statefulset.apps/web edited

[root@k8s-master ~]# kubectl rollout history sts web
statefulset.apps/web
REVISION  CHANGE-CAUSE
1         <none>
2         <none>

[root@k8s-master ~]# kubectl rollout history sts web --revision=2
statefulset.apps/web with revision #2
Pod Template:
  Labels:       app=nginx
  Containers:
   nginx:
    Image:      nginx:1.9.1
    Port:       80/TCP
    Host Port:  0/TCP
    Environment:        <none>
    Mounts:     <none>
  Volumes:      <none>

镜像更新的具体过程：（从最后四条事件可以看到是先删除web-1、再创建新的web-1；删除web-0、再创建新的web-0）

[root@k8s-master ~]#  kubectl describe sts web
Name:               web
Namespace:          default
CreationTimestamp:  Fri, 29 Dec 2023 22:30:25 +0800
Selector:           app=nginx
Labels:             <none>
Annotations:        <none>
Replicas:           2 desired | 2 total
Update Strategy:    RollingUpdate
  Partition:        0
Pods Status:        2 Running / 0 Waiting / 0 Succeeded / 0 Failed
Pod Template:
  Labels:  app=nginx
  Containers:
   nginx:
    Image:        nginx:1.9.1
    Port:         80/TCP
    Host Port:    0/TCP
    Environment:  <none>
    Mounts:       <none>
  Volumes:        <none>
Volume Claims:    <none>
Events:
  Type    Reason            Age                  From                    Message
  ----    ------            ----                 ----                    -------
  Normal  SuccessfulCreate  36m                  statefulset-controller  create Pod web-2 in StatefulSet web successful
  Normal  SuccessfulCreate  36m                  statefulset-controller  create Pod web-3 in StatefulSet web successful
  Normal  SuccessfulCreate  36m                  statefulset-controller  create Pod web-4 in StatefulSet web successful
  Normal  SuccessfulDelete  19m                  statefulset-controller  delete Pod web-4 in StatefulSet web successful
  Normal  SuccessfulDelete  19m                  statefulset-controller  delete Pod web-3 in StatefulSet web successful
  Normal  SuccessfulDelete  19m                  statefulset-controller  delete Pod web-2 in StatefulSet web successful
  Normal  SuccessfulDelete  7m11s                statefulset-controller  delete Pod web-1 in StatefulSet web successful
  Normal  SuccessfulCreate  7m10s (x2 over 22h)  statefulset-controller  create Pod web-1 in StatefulSet web successful
  Normal  SuccessfulDelete  7m8s                 statefulset-controller  delete Pod web-0 in StatefulSet web successful
  Normal  SuccessfulCreate  7m6s (x2 over 22h)   statefulset-controller  create Pod web-0 in StatefulSet web successful

3.3.1 RollingUpdate

StatefulSet 也可以采用滚动更新策略，同样是修改 template 属性后会触发更新，但是由于 pod 是有序的，在 StatefulSet 中更新时是基于 pod 的顺序，倒序更新的。

3.3.2 灰度发布 / 金丝雀发布

利用 updateStrategy 中 rollingUpdate 的 partition 属性，可以实现简易的灰度发布的效果。目的是将项目上线后产生问题的影响，尽量降到最低。

利用该机制，我们可以通过控制 partition 的值，来决定只更新其中一部分 pod，确认没有问题后再逐步增大更新的 pod 数量，最终实现全部 pod 更新。

  updateStrategy:
    rollingUpdate:
      partition: 0
    type: RollingUpdate

例如我们有 5 个 pod，如果当前 partition 设置为 3，那么此时滚动更新时，只会更新那些序号 >= 3 的 pod。（在 StatefulSet 中更新时是基于 pod 的顺序，倒序更新的。）

等到序号 >= 3 的 pod更新完成后，再继续将 partition 设置为 2 或 1，就可以继续更新序号 >= 2 或 1 的 pod，这样逐步趋于 0。

步骤：

把 StatefulSet 为 web 的副本扩展到5个：（web0到web-4的 image 均是1.9.1）

kubectl scale statefulset web --replicas=5

把 updateStrategy 中 rollingUpdate 的 partition 从 0 改为 3，然后把 image 从1.9.1 改为1.7.9

kubectl edit statefulset web

查看各 pod 的镜像变化（可以发现只有web-4、web-3的image从1.9.1 改为了1.7.9，web-2、web-1、web-0的image依旧是1.9.1）

# 查看 web-4、web-3，以web-3为例
kubectl describe po web-4
kubectl describe po web-3

[root@k8s-master statefulset]# kubectl describe po web-3
Name:         web-3
Namespace:    default
Priority:     0
Node:         k8s-node1/192.168.3.242
Start Time:   Sun, 31 Dec 2023 09:39:49 +0800
Labels:       app=nginx
              controller-revision-hash=web-6c5c7fd59b
              statefulset.kubernetes.io/pod-name=web-3
Annotations:  cni.projectcalico.org/containerID: 3d2d85e0bfc230a058952778c01b1f32d6b780dbfb1186d108e24cc33e1da107
              cni.projectcalico.org/podIP: 10.244.36.78/32
              cni.projectcalico.org/podIPs: 10.244.36.78/32
Status:       Running
IP:           10.244.36.78
IPs:
  IP:           10.244.36.78
Controlled By:  StatefulSet/web
Containers:
  nginx:
    Container ID:   docker://a515f130287700a6dc9a5feb6fa180ea8b91d4eb47051aee5e731169c4b9f5e1
    Image:          nginx:1.7.9
    Image ID:       docker-pullable://nginx@sha256:e3456c851a152494c3e4ff5fcc26f240206abac0c9d794affb40e0714846c451
    Port:           80/TCP
    Host Port:      0/TCP
    State:          Running
      Started:      Sun, 31 Dec 2023 09:39:50 +0800
    Ready:          True
    Restart Count:  0
    Environment:    <none>
    Mounts:
      /var/run/secrets/kubernetes.io/serviceaccount from kube-api-access-7cznh (ro)
Conditions:
  Type              Status
  Initialized       True
  Ready             True
  ContainersReady   True
  PodScheduled      True
Volumes:
  kube-api-access-7cznh:
    Type:                    Projected (a volume that contains injected data from multiple sources)
    TokenExpirationSeconds:  3607
    ConfigMapName:           kube-root-ca.crt
    ConfigMapOptional:       <nil>
    DownwardAPI:             true
QoS Class:                   BestEffort
Node-Selectors:              <none>
Tolerations:                 node.kubernetes.io/not-ready:NoExecute op=Exists for 300s
                             node.kubernetes.io/unreachable:NoExecute op=Exists for 300s
Events:
  Type    Reason     Age   From               Message
  ----    ------     ----  ----               -------
  Normal  Scheduled  112s  default-scheduler  Successfully assigned default/web-3 to k8s-node1
  Normal  Pulled     111s  kubelet            Container image "nginx:1.7.9" already present on machine
  Normal  Created    111s  kubelet            Created container nginx
  Normal  Started    111s  kubelet            Started container nginx

# 查看 web-2、web-1、web-0，以web-2为例
kubectl describe po web-2
kubectl describe po web-1
kubectl describe po web-0

[root@k8s-master statefulset]# kubectl describe po web-2
Name:         web-2
Namespace:    default
Priority:     0
Node:         k8s-node1/192.168.3.242
Start Time:   Sun, 31 Dec 2023 09:34:14 +0800
Labels:       app=nginx
              controller-revision-hash=web-6bc849cb6b
              statefulset.kubernetes.io/pod-name=web-2
Annotations:  cni.projectcalico.org/containerID: 0ba36375d747e1055a0215fc41520a3084622a995053af5055f083d08a37a547
              cni.projectcalico.org/podIP: 10.244.36.76/32
              cni.projectcalico.org/podIPs: 10.244.36.76/32
Status:       Running
IP:           10.244.36.76
IPs:
  IP:           10.244.36.76
Controlled By:  StatefulSet/web
Containers:
  nginx:
    Container ID:   docker://d14a9dedbbb33b86a45e7feb4717fb4b4b5def92507a7f0b92e601132634988f
    Image:          nginx:1.9.1
    Image ID:       docker-pullable://nginx@sha256:2f68b99bc0d6d25d0c56876b924ec20418544ff28e1fb89a4c27679a40da811b
    Port:           80/TCP
    Host Port:      0/TCP
    State:          Running
      Started:      Sun, 31 Dec 2023 09:34:15 +0800
    Ready:          True
    Restart Count:  0
    Environment:    <none>
    Mounts:
      /var/run/secrets/kubernetes.io/serviceaccount from kube-api-access-544jm (ro)
Conditions:
  Type              Status
  Initialized       True
  Ready             True
  ContainersReady   True
  PodScheduled      True
Volumes:
  kube-api-access-544jm:
    Type:                    Projected (a volume that contains injected data from multiple sources)
    TokenExpirationSeconds:  3607
    ConfigMapName:           kube-root-ca.crt
    ConfigMapOptional:       <nil>
    DownwardAPI:             true
QoS Class:                   BestEffort
Node-Selectors:              <none>
Tolerations:                 node.kubernetes.io/not-ready:NoExecute op=Exists for 300s
                             node.kubernetes.io/unreachable:NoExecute op=Exists for 300s
Events:
  Type    Reason     Age    From               Message
  ----    ------     ----   ----               -------
  Normal  Scheduled  7m40s  default-scheduler  Successfully assigned default/web-2 to k8s-node1
  Normal  Pulled     7m39s  kubelet            Container image "nginx:1.9.1" already present on machine
  Normal  Created    7m39s  kubelet            Created container nginx
  Normal  Started    7m39s  kubelet            Started container nginx

继续把 updateStrategy 中 rollingUpdate 的 partition 从 3 改为 1，还是把 image 从1.9.1 改为1.7.9
查看各 pod 的镜像变化（可以发现除了web-4、web-3，web-2、web-1的image也从1.9.1 改为了1.7.9，web-0的image依旧是1.9.1）

# 查看 web-2、web-1，以web-1为例
[root@k8s-master statefulset]# kubectl describe po web-1
Name:         web-1
Namespace:    default
Priority:     0
Node:         k8s-node2/192.168.3.243
Start Time:   Sun, 31 Dec 2023 09:50:11 +0800
Labels:       app=nginx
              controller-revision-hash=web-6c5c7fd59b
              statefulset.kubernetes.io/pod-name=web-1
Annotations:  cni.projectcalico.org/containerID: d386a2c85ea388ce70b9a98ccb64032d4364ad548a0d59bc751ca91ac33c6e9b
              cni.projectcalico.org/podIP: 10.244.169.143/32
              cni.projectcalico.org/podIPs: 10.244.169.143/32
Status:       Running
IP:           10.244.169.143
IPs:
  IP:           10.244.169.143
Controlled By:  StatefulSet/web
Containers:
  nginx:
    Container ID:   docker://a40879bd7a3d561a73e026ff039745f3587427c2725fcda649938be6adaeed2a
    Image:          nginx:1.7.9
    Image ID:       docker-pullable://nginx@sha256:e3456c851a152494c3e4ff5fcc26f240206abac0c9d794affb40e0714846c451
    Port:           80/TCP
    Host Port:      0/TCP
    State:          Running
      Started:      Sun, 31 Dec 2023 09:50:12 +0800
    Ready:          True
    Restart Count:  0
    Environment:    <none>
    Mounts:
      /var/run/secrets/kubernetes.io/serviceaccount from kube-api-access-qrsdj (ro)
Conditions:
  Type              Status
  Initialized       True
  Ready             True
  ContainersReady   True
  PodScheduled      True
Volumes:
  kube-api-access-qrsdj:
    Type:                    Projected (a volume that contains injected data from multiple sources)
    TokenExpirationSeconds:  3607
    ConfigMapName:           kube-root-ca.crt
    ConfigMapOptional:       <nil>
    DownwardAPI:             true
QoS Class:                   BestEffort
Node-Selectors:              <none>
Tolerations:                 node.kubernetes.io/not-ready:NoExecute op=Exists for 300s
                             node.kubernetes.io/unreachable:NoExecute op=Exists for 300s
Events:
  Type    Reason     Age   From               Message
  ----    ------     ----  ----               -------
  Normal  Scheduled  17s   default-scheduler  Successfully assigned default/web-1 to k8s-node2
  Normal  Pulled     16s   kubelet            Container image "nginx:1.7.9" already present on machine
  Normal  Created    16s   kubelet            Created container nginx
  Normal  Started    16s   kubelet            Started container nginx

# 查看 web-0

[root@k8s-master statefulset]# kubectl describe po web-0
Name:         web-0
Namespace:    default
Priority:     0
Node:         k8s-node2/192.168.3.243
Start Time:   Sun, 31 Dec 2023 09:34:18 +0800
Labels:       app=nginx
              controller-revision-hash=web-6bc849cb6b
              statefulset.kubernetes.io/pod-name=web-0
Annotations:  cni.projectcalico.org/containerID: cac2f3c8afa1daf2b2d4805fe1c92356aa7c8f6fa5f6bd07acc4d3a50be7c41c
              cni.projectcalico.org/podIP: 10.244.169.141/32
              cni.projectcalico.org/podIPs: 10.244.169.141/32
Status:       Running
IP:           10.244.169.141
IPs:
  IP:           10.244.169.141
Controlled By:  StatefulSet/web
Containers:
  nginx:
    Container ID:   docker://536426425e1524fd3d71c318aaddd884867f7bb68d9ced331e587c9799f713b7
    Image:          nginx:1.9.1
    Image ID:       docker-pullable://nginx@sha256:2f68b99bc0d6d25d0c56876b924ec20418544ff28e1fb89a4c27679a40da811b
    Port:           80/TCP
    Host Port:      0/TCP
    State:          Running
      Started:      Sun, 31 Dec 2023 09:34:19 +0800
    Ready:          True
    Restart Count:  0
    Environment:    <none>
    Mounts:
      /var/run/secrets/kubernetes.io/serviceaccount from kube-api-access-2pgwf (ro)
Conditions:
  Type              Status
  Initialized       True
  Ready             True
  ContainersReady   True
  PodScheduled      True
Volumes:
  kube-api-access-2pgwf:
    Type:                    Projected (a volume that contains injected data from multiple sources)
    TokenExpirationSeconds:  3607
    ConfigMapName:           kube-root-ca.crt
    ConfigMapOptional:       <nil>
    DownwardAPI:             true
QoS Class:                   BestEffort
Node-Selectors:              <none>
Tolerations:                 node.kubernetes.io/not-ready:NoExecute op=Exists for 300s
                             node.kubernetes.io/unreachable:NoExecute op=Exists for 300s
Events:
  Type    Reason     Age   From               Message
  ----    ------     ----  ----               -------
  Normal  Scheduled  16m   default-scheduler  Successfully assigned default/web-0 to k8s-node2
  Normal  Pulled     16m   kubelet            Container image "nginx:1.9.1" already present on machine
  Normal  Created    16m   kubelet            Created container nginx
  Normal  Started    16m   kubelet            Started container nginx

把 updateStrategy 中 rollingUpdate 的 partition 从 1 改为 0，然后把 image 从1.9.1 改为1.7.9，至此完成整个镜像的更新。

3.3.3 OnDelete

只有在 pod 被删除时会进行更新操作，也就是删除某个 pod 后，会重新创建一个新的同名 pod，从而达到更新的目的。

这样可以实现只更新某个指定的 pod。

  updateStrategy:
   # rollingUpdate:
   #   partition: 0
   # type: RollingUpdate
    type: OnDelete

3.3.2 灰度发布 / 金丝雀发布 操作完毕后 image 全部从1.9.1 改为了1.7.9。
步骤：

把 updateStrategy 中 rollingUpdate 的相关配置注释掉，同时将更新策略的类型从 RollingUpdate 改为 OnDelete（然后把 image 从1.7.9 改为1.9.1）

kubectl edit statefulset web

在这里插入图片描述
2. 查看 pod 是 web-4 的信息（可以发现image依旧是1.7.9，且在最下面 Events 列表中也没有显示变动日志）

[root@k8s-master statefulset]# kubectl describe po web-4
Name:         web-4
Namespace:    default
Priority:     0
Node:         k8s-node1/192.168.3.242
Start Time:   Sun, 31 Dec 2023 09:39:47 +0800
Labels:       app=nginx
              controller-revision-hash=web-6c5c7fd59b
              statefulset.kubernetes.io/pod-name=web-4
Annotations:  cni.projectcalico.org/containerID: 5fea7938b6dabd02a07ece3afb77eb827c16bf96f0902ed2d3e84584b41b2b19
              cni.projectcalico.org/podIP: 10.244.36.77/32
              cni.projectcalico.org/podIPs: 10.244.36.77/32
Status:       Running
IP:           10.244.36.77
IPs:
  IP:           10.244.36.77
Controlled By:  StatefulSet/web
Containers:
  nginx:
    Container ID:   docker://d4ead41d6f391de3151bf5bb4b3498418184691c9fc824fda48d25aca8afb28d
    Image:          nginx:1.7.9
    Image ID:       docker-pullable://nginx@sha256:e3456c851a152494c3e4ff5fcc26f240206abac0c9d794affb40e0714846c451
    Port:           80/TCP
    Host Port:      0/TCP
    State:          Running
      Started:      Sun, 31 Dec 2023 09:39:48 +0800
    Ready:          True
    Restart Count:  0
    Environment:    <none>
    Mounts:
      /var/run/secrets/kubernetes.io/serviceaccount from kube-api-access-clh6d (ro)
Conditions:
  Type              Status
  Initialized       True
  Ready             True
  ContainersReady   True
  PodScheduled      True
Volumes:
  kube-api-access-clh6d:
    Type:                    Projected (a volume that contains injected data from multiple sources)
    TokenExpirationSeconds:  3607
    ConfigMapName:           kube-root-ca.crt
    ConfigMapOptional:       <nil>
    DownwardAPI:             true
QoS Class:                   BestEffort
Node-Selectors:              <none>
Tolerations:                 node.kubernetes.io/not-ready:NoExecute op=Exists for 300s
                             node.kubernetes.io/unreachable:NoExecute op=Exists for 300s
Events:
  Type    Reason     Age   From               Message
  ----    ------     ----  ----               -------
  Normal  Scheduled  25m   default-scheduler  Successfully assigned default/web-4 to k8s-node1
  Normal  Pulled     25m   kubelet            Container image "nginx:1.7.9" already present on machine
  Normal  Created    25m   kubelet            Created container nginx
  Normal  Started    25m   kubelet            Started container nginx

删除 pod 是 web-4

kubectl delete po web-4

[root@k8s-master statefulset]# kubectl delete po web-4
pod "web-4" deleted

再次查看 pod 是 web-4 的信息（可以发现 image 改为了 1.9.1，且在最下面 Events 列表中看到是18S前发生的变化）

[root@k8s-master statefulset]# kubectl describe po web-4
Name:         web-4
Namespace:    default
Priority:     0
Node:         k8s-node1/192.168.3.242
Start Time:   Sun, 31 Dec 2023 10:08:53 +0800
Labels:       app=nginx
              controller-revision-hash=web-6bc849cb6b
              statefulset.kubernetes.io/pod-name=web-4
Annotations:  cni.projectcalico.org/containerID: 638ae0252ecff158173d47826483023b157695ef5d35bce8db2c775e9b4c4a02
              cni.projectcalico.org/podIP: 10.244.36.79/32
              cni.projectcalico.org/podIPs: 10.244.36.79/32
Status:       Running
IP:           10.244.36.79
IPs:
  IP:           10.244.36.79
Controlled By:  StatefulSet/web
Containers:
  nginx:
    Container ID:   docker://a038da90c25fa18096ba833a0a51a65a27576c552609c3e72c67b397133513fc
    Image:          nginx:1.9.1
    Image ID:       docker-pullable://nginx@sha256:2f68b99bc0d6d25d0c56876b924ec20418544ff28e1fb89a4c27679a40da811b
    Port:           80/TCP
    Host Port:      0/TCP
    State:          Running
      Started:      Sun, 31 Dec 2023 10:08:54 +0800
    Ready:          True
    Restart Count:  0
    Environment:    <none>
    Mounts:
      /var/run/secrets/kubernetes.io/serviceaccount from kube-api-access-ccnbf (ro)
Conditions:
  Type              Status
  Initialized       True
  Ready             True
  ContainersReady   True
  PodScheduled      True
Volumes:
  kube-api-access-ccnbf:
    Type:                    Projected (a volume that contains injected data from multiple sources)
    TokenExpirationSeconds:  3607
    ConfigMapName:           kube-root-ca.crt
    ConfigMapOptional:       <nil>
    DownwardAPI:             true
QoS Class:                   BestEffort
Node-Selectors:              <none>
Tolerations:                 node.kubernetes.io/not-ready:NoExecute op=Exists for 300s
                             node.kubernetes.io/unreachable:NoExecute op=Exists for 300s
Events:
  Type    Reason     Age   From               Message
  ----    ------     ----  ----               -------
  Normal  Scheduled  19s   default-scheduler  Successfully assigned default/web-4 to k8s-node1
  Normal  Pulled     18s   kubelet            Container image "nginx:1.9.1" already present on machine
  Normal  Created    18s   kubelet            Created container nginx
  Normal  Started    18s   kubelet            Started container nginx

依次删除 web-3、web-2、web-1、web-0 可实现image版本的更新

3.4 删除 StatefulSet 及其关联

StatefulSet 创建时会关联 Service 、PVC、Pod ，中间没有 ReplicaSet（RS）。

级联删除：
在删除 StatefulSet 时，默认关联的 Pod 会一起删除，也就是级联删除，但 PVC、 Service 不会一起删除。

# 级联删除：删除 statefulset 时会同时删除 pods
kubectl delete statefulset web

[root@k8s-master statefulset]# kubectl delete sts web
statefulset.apps "web" deleted

[root@k8s-master statefulset]# kubectl get sts
No resources found in default namespace.

[root@k8s-master statefulset]# kubectl get svc
NAME         TYPE        CLUSTER-IP   EXTERNAL-IP   PORT(S)   AGE
kubernetes   ClusterIP   10.96.0.1    <none>        443/TCP   3d17h
nginx        ClusterIP   None         <none>        80/TCP    87m

[root@k8s-master statefulset]# kubectl get po
NAME       READY   STATUS    RESTARTS      AGE
dns-test   1/1     Running   1 (85m ago)   86m

[root@k8s-master statefulset]# kubectl get pvc
No resources found in default namespace.

非级联删除：在删除 StatefulSet 时，默认关联的 Pod 不会一起删除，只删除 StatefulSet 本身，PVC、 Service 也不会删除。

# 非级联删除：删除 statefulset 时不会删除 pods，删除 sts 后，pods 就没人管了，此时再删除 pod 不会重建的
kubectl delete sts web --cascade=orphan

[root@k8s-master statefulset]# kubectl delete sts web --cascade=false
warning: --cascade=false is deprecated (boolean value) and can be replaced with --cascade=orphan.
statefulset.apps "web" deleted

[root@k8s-master statefulset]# kubectl get sts
No resources found in default namespace.

[root@k8s-master statefulset]# kubectl get svc
NAME         TYPE        CLUSTER-IP   EXTERNAL-IP   PORT(S)   AGE
kubernetes   ClusterIP   10.96.0.1    <none>        443/TCP   3d17h
nginx        ClusterIP   None         <none>        80/TCP    2m42s

[root@k8s-master statefulset]# kubectl get pod
NAME       READY   STATUS    RESTARTS      AGE
dns-test   1/1     Running   1 (92m ago)   93m
web-0      1/1     Running   0             2m50s
web-1      1/1     Running   0             2m48s

[root@k8s-master statefulset]# kubectl get pvc
No resources found in default namespace.

删除 Pod：

[root@k8s-master statefulset]# kubectl get po
NAME       READY   STATUS    RESTARTS      AGE
dns-test   1/1     Running   1 (95m ago)   96m
web-0      1/1     Running   0             6m22s
web-1      1/1     Running   0             6m20s

[root@k8s-master statefulset]# kubectl delete po web-0 web-1
pod "web-0" deleted
pod "web-1" deleted

[root@k8s-master statefulset]# kubectl get po
NAME       READY   STATUS    RESTARTS      AGE
dns-test   1/1     Running   1 (96m ago)   97m

删除 Service：

[root@k8s-master statefulset]# kubectl get svc
NAME         TYPE        CLUSTER-IP   EXTERNAL-IP   PORT(S)   AGE
kubernetes   ClusterIP   10.96.0.1    <none>        443/TCP   3d17h
nginx        ClusterIP   None         <none>        80/TCP    7m53s

[root@k8s-master statefulset]# kubectl delete svc nginx
service "nginx" deleted

[root@k8s-master statefulset]# kubectl get svc
NAME         TYPE        CLUSTER-IP   EXTERNAL-IP   PORT(S)   AGE
kubernetes   ClusterIP   10.96.0.1    <none>        443/TCP   3d17h

3.5 删除 StatefulSet 关联的 PVC

如果有关联的 PVC 则删除，没有则不删除。

# StatefulSet删除后PVC还会保留着，数据不再使用的话也需要删除
$ kubectl delete pvc www-web-0 www-web-1

3.6 配置文件（与 3.1 创建 StatefulSet 用的一致）

注意：配置文件中有---分割，这是用于说明在这个yaml的配置文件里嵌套了另一个yaml的内容。

---
apiVersion: v1
kind: Service
metadata:
  name: nginx
  labels:
    app: nginx
spec:
  ports:
  - port: 80
    name: web
  clusterIP: None
  selector:
    app: nginx
---
apiVersion: apps/v1
kind: StatefulSet # StatefulSet 类型的资源
metadata:
  name: web # StatefulSet 对象的名字
spec:
  serviceName: "nginx" # 使用哪个 service来管理 dns（这里使用nginx的service，因为在nginx的metadata的name是nginx）
  replicas: 2
  selector: # 选择器，用于找到匹配的 RS
    matchLabels: # 按照标签匹配
      app: nginx # 匹配的标签key/value
  template:
    metadata:
      labels:
        app: nginx
    spec:
      containers:
      - name: nginx
        image: nginx:1.7.9
        ports: # 容器内部要暴露的端口
        - containerPort: 80 # 容器内部具体要暴露的端口号
          name: web # 该端口号配置的名字
        volumeMounts: # 加载数据卷
        - name: www # 加载哪个数据卷
          mountPath: /usr/share/nginx/html # 加载到容器中的哪个目录
  volumeClaimTemplates: # 数据卷模板
  - metadata: # 数据卷描述
      name: www # 数据卷的名称
      annotations: # 数据卷的注解
        volume.alpha.kubernetes.io/storage-class: anything
    spec: # 数据卷的规约
      accessModes: [ "ReadWriteOnce" ] # 访问模式
      resources:
        requests:
          storage: 1Gi # 需要的存储资源大小

4 DaemonSet

会根据 DaemonSet 绑定的 Node 标签，为每一个匹配到的 Node 都自动部署一个有守护进程的 Pod。

即使后面又增加了新的节点，只要新的节点设置的标签和 DaemonSet 绑定的 Node 标签一致，DaemonSet 就会继续为这些新增加的节点自动部署一个有守护进程 Pod。
在这里插入图片描述

示例图：（收集 Node1、Node2、Node3 产生的日志）
在这里插入图片描述

4.1 配置文件

apiVersion: apps/v1
kind: DaemonSet # 创建 DaemonSet 资源
metadata:
  name: fluentd # DaemonSet 资源的名称
spec:
  selector:
    matchLabels:
      app: logging # 和下面 template.metadata.labels.app是匹配的
  template:
    metadata:
      labels:
        app: logging
        id: fluentd
      name: fluentd # Pod 的名字
    spec:
      containers:
        - name: fluentd-es # 容器的名称
          # image: k8s.gcr.io/fluentd-elasticsearch:v1.3.0 # 容器使用的镜像
          image: agilestacks/fluentd-elasticsearch:v1.3.0 # 容器使用的镜像
          env: # 环境变量配置
            - name: FLUENTD_ARGS # 环境变量的 key
              value: -qq # 环境变量的 value
          volumeMounts: # 加载数据卷，防止数据丢失
            - name: containers # 数据卷名称
              mountPath: /var/lib/docker/containers # 将数据卷挂载到容器内哪个目录
            - name: varlog
              mountPath: /varlog
      volumes: # 定义数据卷
        - hostPath: # 数据卷类型，主机路径的模式，也就是与 node 共享目录
            path: /var/lib/docker/containers # node中的共享目录 （将服务器的目录挂载到容器内部，如果服务器内不存在该目录，则会自动创建该目录）
          name: containers # 定义的数据卷名称
        - hostPath:
            path: /var/log
          name: varlog

4.2 创建 DaemonSet

创建 DaemonSet 的文件夹

make /opt/k8s/daemonset/

在/opt/k8s/daemonset/下编写配置文件fluentd-ds.yaml（来自 4.1 配置文件，未指定绑定的 node）

apiVersion: apps/v1
kind: DaemonSet # 创建 DaemonSet 资源
metadata:
  name: fluentd # DaemonSet 资源的名称
spec:
  selector:
    matchLabels:
      app: logging # 和下面 template.metadata.labels.app是匹配的
  template:
    metadata:
      labels:
        app: logging
        id: fluentd
      name: fluentd # Pod 的名字
    spec:
      containers:
        - name: fluentd-es # 容器的名称
          # image: k8s.gcr.io/fluentd-elasticsearch:v1.3.0 # 容器使用的镜像
          image: agilestacks/fluentd-elasticsearch:v1.3.0 # 容器使用的镜像
          env: # 环境变量配置
            - name: FLUENTD_ARGS # 环境变量的 key
              value: -qq # 环境变量的 value
          volumeMounts: # 加载数据卷，防止数据丢失
            - name: containers # 数据卷名称
              mountPath: /var/lib/docker/containers # 将数据卷挂载到容器内哪个目录
            - name: varlog
              mountPath: /varlog
      volumes: # 定义数据卷
        - hostPath: # 数据卷类型，主机路径的模式，也就是与 node 共享目录
            path: /var/lib/docker/containers # node中的共享目录 （将服务器的目录挂载到容器内部，如果服务器内不存在该目录，则会自动创建该目录）
          name: containers # 定义的数据卷名称
        - hostPath:
            path: /var/log
          name: varlog

根据配置文件创建 DaemonSet 应用

kubectl create -f fluentd-ds.yaml

[root@k8s-master daemonset]# kubectl create -f fluentd-ds.yaml
daemonset.apps/fluentd created

查看创建的 DaemonSet 应用
DaemonSet 的 READY 都是 0，进一步查看 Pod，发现 Pod 的状态也处于 创建中 或者 镜像拉取失败，原因都是镜像拉取失败，主要是网速差，解决办法是使用 Docker 命令单独拉取该镜像。（因一直未拉取成功，暂时跳过）

kubectl get daemonset

kubectl get ds

[root@k8s-master daemonset]# kubectl get daemonset
NAME      DESIRED   CURRENT   READY   UP-TO-DATE   AVAILABLE   NODE SELECTOR   AGE
fluentd   2         2         0       2            0           <none>          20s

[root@k8s-master daemonset]# kubectl get ds
NAME      DESIRED   CURRENT   READY   UP-TO-DATE   AVAILABLE   NODE SELECTOR   AGE
fluentd   2         2         0       2            0           <none>          22s

[root@k8s-master daemonset]# kubectl get po
NAME            READY   STATUS              RESTARTS     AGE
dns-test        1/1     Running             1 (9h ago)   9h
fluentd-96ms8   0/1     ContainerCreating   0            5m21s
fluentd-vbttv   0/1     ImagePullBackOff    0            5m21s

[root@k8s-master daemonset]# kubectl describe po fluentd-vbttv
Name:         fluentd-vbttv
Namespace:    default
Priority:     0
Node:         k8s-node1/192.168.3.242
Start Time:   Sun, 31 Dec 2023 18:29:32 +0800
Labels:       app=logging
              controller-revision-hash=b96747bc7
              id=fluentd
              pod-template-generation=1
Annotations:  cni.projectcalico.org/containerID: 7df8b185447eedde818ee0acdebceb1cf02fe85d6b17a409f2749239a010ba93
              cni.projectcalico.org/podIP: 10.244.36.83/32
              cni.projectcalico.org/podIPs: 10.244.36.83/32
Status:       Pending
IP:           10.244.36.83
IPs:
  IP:           10.244.36.83
Controlled By:  DaemonSet/fluentd
Containers:
  fluentd-es:
    Container ID:
    Image:          agilestacks/fluentd-elasticsearch:v1.3.0
    Image ID:
    Port:           <none>
    Host Port:      <none>
    State:          Waiting
      Reason:       ImagePullBackOff
    Ready:          False
    Restart Count:  0
    Environment:
      FLUENTD_ARGS:  -qq
    Mounts:
      /var/lib/docker/containers from containers (rw)
      /var/run/secrets/kubernetes.io/serviceaccount from kube-api-access-q6cwq (ro)
      /varlog from varlog (rw)
Conditions:
  Type              Status
  Initialized       True
  Ready             False
  ContainersReady   False
  PodScheduled      True
Volumes:
  containers:
    Type:          HostPath (bare host directory volume)
    Path:          /var/lib/docker/containers
    HostPathType:
  varlog:
    Type:          HostPath (bare host directory volume)
    Path:          /var/log
    HostPathType:
  kube-api-access-q6cwq:
    Type:                    Projected (a volume that contains injected data from multiple sources)
    TokenExpirationSeconds:  3607
    ConfigMapName:           kube-root-ca.crt
    ConfigMapOptional:       <nil>
    DownwardAPI:             true
QoS Class:                   BestEffort
Node-Selectors:              <none>
Tolerations:                 node.kubernetes.io/disk-pressure:NoSchedule op=Exists
                             node.kubernetes.io/memory-pressure:NoSchedule op=Exists
                             node.kubernetes.io/not-ready:NoExecute op=Exists
                             node.kubernetes.io/pid-pressure:NoSchedule op=Exists
                             node.kubernetes.io/unreachable:NoExecute op=Exists
                             node.kubernetes.io/unschedulable:NoSchedule op=Exists
Events:
  Type     Reason     Age                    From               Message
  ----     ------     ----                   ----               -------
  Normal   Scheduled  8m41s                  default-scheduler  Successfully assigned default/fluentd-trxm7 to k8s-node1
  Warning  Failed     3m36s                  kubelet            Failed to pull image "agilestacks/fluentd-elasticsearch:v1.3.0": rpc error: code = Unknown desc = context canceled
  Warning  Failed     3m36s                  kubelet            Error: ErrImagePull
  Normal   BackOff    3m35s                  kubelet            Back-off pulling image "agilestacks/fluentd-elasticsearch:v1.3.0"
  Warning  Failed     3m35s                  kubelet            Error: ImagePullBackOff
  Normal   Pulling    3m24s (x2 over 8m40s)  kubelet            Pulling image "agilestacks/fluentd-elasticsearch:v1.3.0"

查看 fluentd 所在节点
fluentd-vbttv 在 k8s-node1，fluentd-96ms8 在 k8s-node2，均不在 k8s-master 节点上。

Daemonset 未绑定指定的节点时，默认是给所有的子节点加入 Daemonset 。

[root@k8s-master daemonset]# kubectl get po -o wide
NAME            READY   STATUS              RESTARTS     AGE     IP             NODE        NOMINATED NODE   READINESS GATES
dns-test        1/1     Running             1 (9h ago)   9h      10.244.36.71   k8s-node1   <none>           <none>
fluentd-vbttv   0/1     ContainerCreating   0            4m13s   <none>         k8s-node1   <none>           <none>
fluentd-96ms8   0/1     ContainerCreating   0            4m13s   <none>         k8s-node2   <none>           <none>

4.3 指定 Node 节点

DaemonSet 会忽略 Node 的 unschedulable 状态，有两种方式来指定 Pod 只运行在指定的 Node 节点上：

nodeSelector：只调度匹配指定 label 的 Node 上。
nodeAffinity：功能更丰富的 Node 选择器，比如支持集合操作。
podAffinity：调度到满足条件的 Pod 所在的 Node 上。

4.3.1 nodeSelector

可以直接修改 /opt/k8s/daemonset/fluentd-ds.yaml，但是要删除后重新创建 DaemonSet。

或者修改 DaemonSet 配置文件中的 nodeSelector 的属性，自动触发更新操作。（推荐）

给 k8s-node1 加标签

# k8s-node1
kubectl label node k8s-node1 type=microservices

[root@k8s-master daemonset]# kubectl label node k8s-node1 type=microservices
node/k8s-node1 labeled

查看 node 添加的标签：可以看到 k8s-node1 的labels相比于 k8s-node2 最后多了type=microservices。

kubectl get node --show-labels

[root@k8s-master daemonset]# kubectl get node --show-labels
NAME         STATUS   ROLES                  AGE    VERSION   LABELS
k8s-master   Ready    control-plane,master   5d16h   v1.23.6   beta.kubernetes.io/arch=amd64,beta.kubernetes.io/os=linux,kubernetes.io/arch=amd64,kubernetes.io/hostname=k8s-master,kubernetes.io/os=linux,node-role.kubernetes.io/control-plane=,node-role.kubernetes.io/master=,node.kubernetes.io/exclude-from-external-load-balancers=
k8s-node1    Ready    <none>                 5d16h   v1.23.6   beta.kubernetes.io/arch=amd64,beta.kubernetes.io/os=linux,kubernetes.io/arch=amd64,kubernetes.io/hostname=k8s-node1,kubernetes.io/os=linux,type=microservices
k8s-node2    Ready    <none>                 5d16h   v1.23.6   beta.kubernetes.io/arch=amd64,beta.kubernetes.io/os=linux,kubernetes.io/arch=amd64,kubernetes.io/hostname=k8s-node2,kubernetes.io/os=linux

在 DaemonSet 配置中设置 nodeSelector

kubectl edit ds fluentd

示例：

spec:
  template:
    spec:
      nodeSelector:
        type: microservices

完整配置：
在这里插入图片描述
3. 查看 fluentd 所在的节点（这里因为 fluentd 镜像没有拉取成功，所以 k8s-node2 上的 fluentd-96ms8 没有去掉，但是 fluentd-96ms8 已经停止了）

kubectl get ds

[root@k8s-master daemonset]# kubectl get ds
NAME      DESIRED   CURRENT   READY   UP-TO-DATE   AVAILABLE   NODE SELECTOR        AGE
fluentd   1         1         0       0            0           type=microservices   39h

kubectl get po -l app=logging -o wide
[root@k8s-master daemonset]# kubectl get po -l app=logging -o wide
NAME            READY   STATUS              RESTARTS   AGE     IP       NODE        NOMINATED NODE   READINESS GATES
fluentd-96ms8   0/1     Terminating         0          4m27s   <none>   k8s-node2   <none>           <none>
fluentd-vbttv   0/1     ContainerCreating   0          25s     <none>   k8s-node1   <none>           <none>

给 k8s-node2 加标签

# k8s-node2
kubectl label node k8s-node2 type=microservices

[root@k8s-master daemonset]# kubectl label node k8s-node2 type=microservices
node/k8s-node2 labeled

查看 node 添加的标签：可以看到 k8s-node2 的labels也多了 type=microservices。

kubectl get node --show-labels

[root@k8s-master daemonset]# kubectl get node --show-labels
NAME         STATUS   ROLES                  AGE    VERSION   LABELS
k8s-master   Ready    control-plane,master   6d4h   v1.23.6   beta.kubernetes.io/arch=amd64,beta.kubernetes.io/os=linux,kubernetes.io/arch=amd64,kubernetes.io/hostname=k8s-master,kubernetes.io/os=linux,node-role.kubernetes.io/control-plane=,node-role.kubernetes.io/master=,node.kubernetes.io/exclude-from-external-load-balancers=
k8s-node1    Ready    <none>                 6d4h   v1.23.6   beta.kubernetes.io/arch=amd64,beta.kubernetes.io/os=linux,kubernetes.io/arch=amd64,kubernetes.io/hostname=k8s-node1,kubernetes.io/os=linux,type=microservices
k8s-node2    Ready    <none>                 6d4h   v1.23.6   beta.kubernetes.io/arch=amd64,beta.kubernetes.io/os=linux,kubernetes.io/arch=amd64,kubernetes.io/hostname=k8s-node2,kubernetes.io/os=linux,type=microservices

再次查看 fluentd 所在的节点（这里 fluentd 镜像虽然没有拉取成功，但是 fluentd-hshqf、fluentd-vbttv 的状态是重新拉取失败，表明已经在 k8s-node1、k8s-node2 上部署了）

kubectl get po -l app=logging -o wide

[root@k8s-master daemonset]# kubectl get po -l app=logging -o wide
NAME            READY   STATUS             RESTARTS   AGE     IP               NODE        NOMINATED NODE   READINESS GATES
fluentd-hshqf   0/1     ImagePullBackOff   0          2m15s   10.244.169.136   k8s-node2   <none>           <none>
fluentd-vbttv   0/1     ImagePullBackOff   0          14m     10.244.36.71     k8s-node1   <none>           <none>

4.3.2 nodeAffinity（待实践，暂时跳过）

nodeAffinity 目前支持两种：requiredDuringSchedulingIgnoredDuringExecution 和 preferredDuringSchedulingIgnoredDuringExecution，分别代表必须满足条件和优选条件。

比如下面的例子代表调度包含标签 wolfcode.cn/framework-name 并且值为 spring 或 springboot 的 Node 上，并且优选还带有标签 another-node-label-key=another-node-label-value 的Node。

apiVersion: v1
kind: Pod
metadata:
  name: with-node-affinity
spec:
  affinity:
    nodeAffinity:
      requiredDuringSchedulingIgnoredDuringExecution:
        nodeSelectorTerms:
        - matchExpressions:
          - key: wolfcode.cn/framework-name
            operator: In
            values:
            - spring
            - springboot
      preferredDuringSchedulingIgnoredDuringExecution:
      - weight: 1
        preference:
          matchExpressions:
          - key: another-node-label-key
            operator: In
            values:
            - another-node-label-value
  containers:
  - name: with-node-affinity
    image: pauseyyf/pause

4.3.3 podAffinity（待实践，暂时跳过）

podAffinity 基于 Pod 的标签来选择 Node，仅调度满足条件Pod 所在的 Node 上，支持 podAffinity 和 podAntiAffinity。这个功能比较绕，以下面的例子为例：

如果一个 “Node 所在空间中包含至少一个带有 auth=oauth2 标签且运行中的 Pod”，那么可以调度该 Node。
不调度 “包含至少一个带有 auth=jwt 标签且运行中 Pod”的 Node 上。

apiVersion: v1
kind: Pod
metadata:
  name: with-pod-affinity
spec:
  affinity:
    podAffinity:
      requiredDuringSchedulingIgnoredDuringExecution:
      - labelSelector:
          matchExpressions:
          - key: auth
            operator: In
            values:
            - oauth2
        topologyKey: failure-domain.beta.kubernetes.io/zone
    podAntiAffinity:
      preferredDuringSchedulingIgnoredDuringExecution:
      - weight: 100
        podAffinityTerm:
          labelSelector:
            matchExpressions:
            - key: auth
              operator: In
              values:
              - jwt
          topologyKey: kubernetes.io/hostname
  containers:
  - name: with-pod-affinity
    image: pauseyyf/pause

4.4 滚动更新

DaemonSet 不建议使用 RollingUpdate 类型策略，建议使用 OnDelete 类型策略，这样可以避免频繁更新 ds（DaemonSet）。

书签

之前所有的联系配置文件都在阿里云盘上，名称是：k8s_2024年1月2日.zip

5 HPA 自动扩 / 缩容

Horizontal Pod Autoscaler（HPA）
针对 Pod 自动扩容：可以根据 CPU 使用率或自定义指标（metrics）自动对 Pod 进行扩/缩容。

控制管理器每隔30s（可以通过–horizontal-pod-autoscaler-sync-period修改）查询metrics的资源使用情况。
支持三种metrics类型：
- 预定义metrics（比如 Pod 的CPU）以利用率的方式计算。
- 自定义的Pod metrics，以原始值（raw value）的方式计算。
- 自定义的object metrics。
支持两种metrics查询方式：Heapster和自定义的REST API。
支持多metrics。

PodTemplate
Pod Template是关于Pod的定义，但是被包含在其他的Kubernetes对象中（例如Deployment、StatefulSet、DaemonSet等控制器）。控制器通过Pod Template信息来创建Pod。

LimitRange
可以对集群内Request和Limits的配置做一个全局的、统一的限制，相当于批量设置了某一个范围内（某个命名空间）的Pod的资源使用限制。

通过观察 pod 的 cpu、内存使用率或自定义 metrics 指标进行自动的扩容或缩容 pod 的数量。

通常用于 Deployment，不适用于无法扩/缩容的对象，如 DaemonSet

控制管理器每隔30s（可以通过–horizontal-pod-autoscaler-sync-period修改）查询metrics的资源使用情况。

5.1 开启指标服务

# 下载 metrics-server 组件配置文件
wget https://github.com/kubernetes-sigs/metrics-server/releases/latest/download/components.yaml -O metrics-server-components.yaml

# 修改镜像地址为国内的地址
sed -i 's/k8s.gcr.io\/metrics-server/registry.cn-hangzhou.aliyuncs.com\/google_containers/g' metrics-server-components.yaml

# 修改容器的 tls 配置，不验证 tls，在 containers 的 args 参数中增加 --kubelet-insecure-tls 参数

# 安装组件
kubectl apply -f metrics-server-components.yaml

# 查看 pod 状态
kubectl get pods --all-namespaces | grep metrics

5.2 cpu、内存指标监控

实现 cpu 或内存的监控，首先有个前提条件是该对象必须配置了 resources.requests.cpu 或 resources.requests.memory 才可以，可以配置当 cpu/memory 达到上述配置的百分比后进行扩容或缩容。

创建一个 HPA：

先准备一个好一个有做资源限制的 deployment
执行命令 kubectl autoscale deploy nginx-deploy --cpu-percent=20 --min=2 --max=5
通过 kubectl get hpa 可以获取 HPA 信息

测试：找到对应服务的 service，编写循环测试脚本提升内存与 cpu 负载。

while true; do wget -q -O- http://<ip:port> > /dev/null ; done

可以通过多台机器执行上述命令，增加负载，当超过负载后可以查看 pods 的扩容情况 kubectl get pods。

查看 pods 资源使用情况

kubectl top pods

扩容测试完成后，再关闭循环执行的指令，让 cpu 占用率降下来，然后过 5 分钟后查看自动缩容情况。

5.3 自定义 metrics

控制管理器开启–horizontal-pod-autoscaler-use-rest-clients
控制管理器的–apiserver指向API Server Aggregator
在API Server Aggregator中注册自定义的metrics API

西木Qi

关注

21
点赞
踩
24

收藏

觉得还不错? 一键收藏
0
评论
k8s学习 — （实践）第四章资源调度

k8s学习 — （实践）第四章资源调度
复制链接

扫一扫

专栏目录

k8s学习 — （实践）第四章 资源调度

k8s学习 — （实践）第四章 资源调度

※ 各章节重要知识点

1 Label 和 Selector

1.1 标签（Label）

1.1.1 配置文件（方式）

1.1.2 kubectl（方式）

1.2 选择器（Selector）

1.2.1 配置文件（方式）

1.2.2 kubectl（方式）

2 Deployment

2.1 创建

2.2 滚动更新

多个滚动更新并行

2.3 回滚

2.4 扩容 / 缩容

2.5 暂停（滚动更新）与恢复（滚动更新）

2.6 配置文件（nginx）

3 StatefulSet

3.1 创建

3.2 扩容 / 缩容

3.2.1 扩容

3.2.2 缩容

3.3 镜像更新

3.3.1 RollingUpdate

3.3.2 灰度发布 / 金丝雀发布

3.3.3 OnDelete

3.4 删除 StatefulSet 及其关联

3.5 删除 StatefulSet 关联的 PVC

3.6 配置文件（与 3.1 创建 StatefulSet 用的一致）

4 DaemonSet

4.1 配置文件

4.2 创建 DaemonSet

4.3 指定 Node 节点

4.3.1 nodeSelector

4.3.2 nodeAffinity（待实践，暂时跳过）

4.3.3 podAffinity（待实践，暂时跳过）

4.4 滚动更新

书签

5 HPA 自动扩 / 缩容

5.1 开启指标服务

5.2 cpu、内存指标监控

5.3 自定义 metrics

“相关推荐”对你有帮助么？

k8s学习 — （实践）第四章资源调度

k8s学习 — （实践）第四章资源调度