kubernetes-工作节点异常时pod的重新调度机制

icepopfh

于 2024-07-07 16:19:57 发布

阅读量509

点赞数 13

分类专栏： kubernetes/docker 文章标签： kubernetes 容器云原生

本文链接：https://blog.csdn.net/icepopfh/article/details/140247921

版权

3 篇文章 0 订阅

订阅专栏

kube-controller-manager会每隔–node-monitor-period=5s时间去调用kube-apiserver读取etcd数据检查 kubelet上报的node状态信息。
kubelet会每隔–node-status-update-frequency=10s时间去调用kube-apiserver上报node状态信息，失败重试次数为–node-status-update-retry=5。
kube-controller-manager和kubelet是异步工作的。

运行中的节点在没有响应的情况下，持续–node-monitor-grace-period=40s后，kube-controller-manager会把node置为notready状态。
新启动的节点在没有响应的情况下，持续–node-startup-grace-period=1m后，kube-controller-manager会把node置为notready状态。

当kube-controller-manager把node状态置为notready后，会在对应的节点打上node.kubernetes.io/not-ready标签。
在kube-apiserver的–default-not-ready-toleration-seconds=300s的参数下，默认会在所有pod自动加上容忍度配置。
在节点被打上node.kubernetes.io/not-ready标签后，触发容忍度机制，默认达到300s后，pod开始迁移。

ps：–pod-eviction-timeout在Kubernetes v1.18版本后被废弃，全部采用TaintBasedEvictions。
ps：当node处于unreachable状态时同理。

当pod使用pv的accessModes为ReadWriteOnce，会导致新pod创建阻塞。
statefulset要保证不会有两个拥有相同标记和存储的pod同时运行，所以statefulset要明确知道一个pod不再运行之后，才会调度新的pod。但是当一个节点突然失效，导致Kubernetes并不知道节点或者它上面的pod的状态，所以statefulset类型在该节点的pod不会被自动调度。

关注