问题现象:
kubectl exec -it podname -n ns bash 命令超时
定位思路:
bash 换成sh检查是否正常
不正常
检查node是否正常
正常
试一下问题pod所在的node上的别的pod是否也不可以进去
也不可以进入
登录到异常节点上执行busctl tree看下
执行发现timeout
此时定位systemd超时导致的节点假死,以致于进入pod卡住
解决办法
systemctl daemon-reexec,执行这个重新加载下systemd
执行完再busctl tree看下还有没有超时现象
此时运行正常,pod可以正常进入了
rpm -qa | grep systemd 看下版本
需要进行变更进行操作
注意:变更前需要将节点设置成不可调度状态
yum update -y systemd && systemctl daemon-reexec && killall runc