【故障排查】VMware挂起后恢复,k8s集群无法ping/curl通pod/svc/ingress

环境简述:

31 master 。 32 node1 。 33 node2 。 34 harbor/docker。

问题现象:

一、master/node节点,去curl pod IP,一直卡着,没反应。timeout。
二、挂起恢复后,harbor服务无法正常访问503 ,需要重启harbor服务。
在这里插入图片描述
进容器curl localhost,是正常的。
在这里插入图片描述
而网络CNI 、flannel 、 coreDNS等都是running状态。 (发现restarts的次数有点多) .这里的metrics-server一直失败的。
在这里插入图片描述

排查:

#下面两个能显示出对应的报错信息
vim /var/log/message
systemctl status kubelet -f

#此时coreDNS、、flannel、kube-proxy 的 describe/logs 日志是正常的
kubectl describe pod  (coredns/flannel/kube-proxy) -n kube-system
kubectl logs  (coredns/flannel/kube-proxy) -n kube-system

最终处理

#通过搜索/问人。有老哥说,这是VMware挂起导致的。 看messages信息,也吻合挂起时间。 (这个问题也没会想到是挂起vm的锅,报错日志也没明确的信息提示是“挂起后”导致的)
systemctl restart docker && systemctl restart kubelet
重启coreDNS、、flannel、kube-proxy。 都没用。

最终reboot重启 k8s集群的机器。


小结:所以挂起vm再唤醒机器,K8s/docker-compose起的服务,网络都可能会有故障。 优先从/var/log/message和systemctl status kubelet -f找出报错信息,提高处理问题效率。

可参考:
https://blog.csdn.net/weixin_43293361/article/details/114731838 《解决 虚拟机挂起后再恢复导致的k8s集群网络问题》

其他-报错日志信息(待写)


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值