PLEG is not healthy: pleg was last seen active 3m45.252087921s ago； threshold is 3m0s

最新推荐文章于 2025-02-18 09:05:44 发布

牛牛Blog

最新推荐文章于 2025-02-18 09:05:44 发布

阅读量5.1k

点赞数 1

分类专栏： Kubernetes 文章标签： Kublet PLEG不健康

本文链接：https://blog.csdn.net/yujia_666/article/details/114696558

版权

Kubernetes 专栏收录该内容

118 篇文章

订阅专栏

本文分析了K8S集群中PLEG不健康导致节点显示notready的问题，阐述了PLEG的工作原理及其与kubelet的关系，提供了两种解决方案：一是删除Dead状态的容器，二是升级systemd版本。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

现象：

node节点 3-5秒间断性地显示 PLEG is not healthy: pleg was last seen active 3m45.252087921s ago; threshold is 3m0s。

node 节点显示 notready。

分析:

K8S集群中，与节点就绪状态有关的组件，主要有四个，分别是集群的核心数据库etcd，集群的入口API Server，节点控制器以及驻守在集群节点上，直接管理节点的kubelet。

一方面，kubelet扮演的是集群控制器的角色，它定期从API Server获取Pod等相关资源的信息，并依照这些信息，控制运行在节点上Pod的执行；另外一方面，kubelet作为节点状况的监视器，它获取节点信息，并以集群客户端的角色，把这些状况同步到API Server。

在这个问题中，kubelet扮演的是第二种角色。

Kubelet会使用上图中的NodeStatus机制，定期检查集群节点状况，并把节点状况同步到API Server。而NodeStatus判断节点就绪状况的一个主要依据，就是PLEG。

pleg是pod生命周期事件生成器"pod lifecycle event generator", 的缩写，基本上它的执行逻辑，是定期检查节点上Pod运行情况，如果发现感兴趣的变化，PLEG就会把这种变化包装成Event发送给Kubelet的主同步机制syncLoop去处理。但是，在PLEG的Pod检查机制不能定期执行的时候，NodeStatus机制就会认为，这个节点的状况是不对的，从而把这种状况同步到API Server。

leg是pod生命周期事件生成器"pod lifecycle event generator", 的缩写。pleg会记录Pod生命周期中的各种事件，如容器的启动、终止等，这些事件会写入缓存中，同时他检测到container异常退出时，他会通知kubelet，然后重启创建该container。（https://github.com/kubernetes/kubernetes/issues/45419#issuecomment-304413713）

pleg在每次迭代检查中会调用docker ps来检测容器状态的变化，并调用docker Inspect来获取这些容器的详细信息。

在完成每次迭代之后，它更新一个时间戳。如果时间戳有一段时间没有更新(即3分钟)，则运行状况检查失败。

所以，原因有可能是docker ps和docker inspect很慢，以至于pleg在检查过程中超时

我们执行下docker ps，发现果然卡住了。

vmstat和top，查看cpu和内存占用，无异常

官方这张PLEG示意图，这个图片主要展示了两个过程。一方面，kubelet作为集群控制器，从API Server处获取pod spec changes，然后通过创建worker线程来创建或结束掉pod；另外一方面，PLEG定期检查容器状态，然后把状态，以事件的形式反馈给kubelet。

PLEG有两个关键的时间参数，一个是检查的执行间隔，另外一个是检查的超时时间。以默认情况为准，PLEG检查会间隔一秒，换句话说，每一次检查过程执行之后，PLEG会等待一秒钟，然后进行下一次检查；而每一次检查的超时时间是三分钟，如果一次PLEG检查操作不能在三分钟内完成，那么这个状况，会被上一节提到的NodeStatus机制，当做集群节点NotReady的凭据，同步给API Server.

1、 describe node 如下

在这里插入图片描述

这句话的意思是PLEG上次处于活跃状态是59小时之前，阈值是3分钟。也就是说pleg在不活跃状态下持续3分钟，node就被标记为not ready状态。

解决方案1：删除node上Dead/Exited状态容器

1、查看节点kubelet日志

docker logs --tail 100 kubelet

PodSandboxStatus of sandbox "3780e5f912" for pod "pangu-gateway-jc5-5c7b77449-2874f_common(20dc3f10-ce23-11e9-b285-525400d43e28)" error: rpc error: code = DeadlineExceeded desc = context deadline exceeded
Failed to stop sandbox "3780e5f9170e1d60d8" before removing: rpc error: code = DeadlineExceeded desc = context deadline exceeded

可见 pod common/pangu-gateway-jc5-5c7b77449-2874f 可能有问题

2、查看此pod

kubectl get pod pangu-gateway-jc5-5c7b77449-2874f -n common

提示并无此pod , not found.

3、docker ps | grep pangu-gateway-jc5

提示并无此pod , not found.

docker ps -a | grep pangu-gateway-jc5

3780e5f912 rancher/pause:3.1 "/pause" About an hour ago Dead About an hour k8s_POD_pangu-gateway-jc5-5c7b77449-2874f_common_20dc3f10-ce23-11e9-b285-525400d43e28

显示此pod 处于Dead状态

4、删除处理Dead状态的容器

docker rm 3780e5f912

或

docker rm -f $(docker ps -a | grep Dead| awk '{print $1}')

如果删除不掉提示,filesystem is busy.

可以：

a、删除对应deployment,重试 docker rm 3780e5f912

b、查看 "删除状态为Dead的容器"

5、最好删除节点上所有处于Dead状态的容器

删除之后，节点状态处于ready状态，不再提示pleg超时问题,问题解决!

解决方案2、登录node 节点，查看kubelet状态，发现是正常的，

在这里插入图片描述

继续查看kubelet日志，还是pleg不健康

通过上面三个日志，我们可以得到：

pleg超时-----》 kubelet不健康 -----》 node not ready。

那么问题来了？ pleg是什么？

pleg是pod生命周期事件生成器"pod lifecycle event generator", 的缩写。pleg会记录Pod生命周期中的各种事件，如容器的启动、终止等，这些事件会写入缓存中，同时他检测到container异常退出时，他会通知kubelet，然后重启创建该container。（https://github.com/kubernetes/kubernetes/issues/45419#issuecomment-304413713）

pleg在每次迭代检查中会调用docker ps来检测容器状态的变化，并调用docker Inspect来获取这些容器的详细信息。

在完成每次迭代之后，它更新一个时间戳。如果时间戳有一段时间没有更新(即3分钟)，则运行状况检查失败。

所以，原因有可能是docker ps和docker inspect很慢，以至于pleg在检查过程中超时

我们执行下docker ps，发现果然卡住了。

vmstat和top，查看cpu和内存占用，无异常

在这里插入图片描述

故障原因
通过参考这边文章【阿里巴巴的】： https://www.infoq.cn/article/t_ZQeWjJLGWGT8BmmiU4

其中说明了原因是systemd的一个bug导致。

临时解决办法是：

在故障节点上执行 systemctl daemon-reexec。执行后故障确实恢复，但是这只是临时解决办法。

根本解决是：将systemd升级到 v242-rc2，升级后需要重启操作系统。（https://github.com/lnykryn/systemd-rhel/pull/322）

需要补充的是

在这里插入图片描述
同时发生的一个故障是，从master 节点ssh到故障节点很慢，通过ssh -vvvv发现
卡在了 pledge: network

然后参考了这篇文章
https://serverfault.com/questions/792486/ssh-connection-takes-forever-to-initiate-stuck-at-pledge-network

查看日志

在这里插入图片描述
查看日志journalctl -u systemd-logind.service -r

在这里插入图片描述

至此，两个故障的原因貌似都指向了systemd。

如上所述，在执行了 systemctl daemon-reexec之后，这个故障也恢复了。

正如前面提到的，根本解决办法是升级systemd。

我们先查看下当前systemd的版本

# systemctl --version
systemd 219
+PAM +AUDIT +SELINUX +IMA -APPARMOR +SMACK +SYSVINIT +UTMP +LIBCRYPTSETUP +GCRYPT +GNUTLS +ACL +XZ -LZ4 -SECCOMP +BLKID +ELFUTILS +KMOD +IDN

如果你想从根本上解决这个故障，你需要升级systemd到v242-rc2版本。升级后可能需要重启操作系统。（是否需要重启我不确定。