问题描述
k8s重新上电后部分业务504错误,但有些业务可以正常访问。
问题原因
重新上电后k8s 的 flannel 和coredns功能未恢复正常。
解决方案
重启coredns flannel 的pod。
定位过程
查看pod,发现业务pod和基础pod状态都正常。
kubectl get pod -A
用busybox测试访问
kubectl exec -it busybox -- sh
发现pod不能ping通service,但直接ping service ip是可以ping通的
说明可能是dns出了问题 ,重启k8s 的dns服务:
kubectl -n kube-system delete pod coredns-5787695b7f-8mcjd