coredns 服务启动不了的相关问题

背景:

首先是由于集群内同一namespace下的网关服务kong无法正常运行(ClusterIp),而Nodeport模式的konga能正常通过浏览器访问,看kong的日志报连接被拒绝的错误。
在这里插入图片描述

排查过程:

然后进入容器测试发现k8s集群的pod之间无法正常通过svc name访问,但通过ip可以访问。说明集群之间的服务发现有问题,此时查看kube-system命名空间下的coredns的pod,果然是coredns没有正常启动。
但此时查看coredns的日志和describe它也没有获得有效的信息,还是没有找到它不能正常启动的原因,然后转化思路,既然coredns也是节点上的容器,那节点的kubelet就应该负责管理控制,于是在node节点上看kubelet容器的日志,果真发现了明显的报错,报无法连接集群的api-server。
在这里插入图片描述

然后果断在该pod所在节点的宿主机上测试该ip的连通性和端口是否开放,发现宿主机上测试时通的;
在这里插入图片描述

然后进行容器的测试,此时犯了个错误,我选择了特殊容器kube-route容器来进行的测试,发现也是通的,但我在部署的engage服务的pod里测试,却是不通的。这一下就完全没有任何思路了,同一个宿主机上的不同容器之间的网络规则居然不同。在这里浪费了很多时间,最后在别人的提醒下,kube-route作为集群网络插件,它本身是不走集群网络的,是走的本地主机,这就导致测试时得到的奇怪结果。

解决:

此时结果基本上出来了,宿主机可以,容器不可以,于是到master上排查iptables规则,果然发现有对docker所设的Drop规则,直接执行iptables -P INPUT ACCEPT将INPUT链上的规则设为接受,此时问题解决,coredns服务起来,服务发现好了,kong的奇怪报错也没了。

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
"CrashLoopBackOff" 是指 CoreDNS Pod 在启动后立即崩溃并无法成功运行的状态。这种状态通常发生在 Pod 的容器出现问题或配置错误的情况下。 要解决 CoreDNS 的 "CrashLoopBackOff" 问题,你可以采取以下步骤进行排查和修复: 1. 查看 Pod 日志:使用以下命令查看 CoreDNS Pod 的日志,以了解导致崩溃的具体错误信息。 ``` kubectl logs <pod-name> -n <namespace> ``` 通过检查日志,你可以找到导致 CoreDNS 崩溃的原因,例如配置错误、依赖项问题等。 2. 检查配置:核对 CoreDNS 的配置文件是否正确。你可以使用以下命令获取 CoreDNS 配置 ConfigMap 的详细信息: ``` kubectl describe configmap <configmap-name> -n <namespace> ``` 确保配置文件中没有语法错误或其他不一致之处。如果有必要,可以修改 ConfigMap 并重新部署 CoreDNS。 3. 检查依赖项:核对 CoreDNS 所依赖的服务和资源是否正常运行。确保所有的依赖项都已正确配置和启动,包括网络、存储等。 4. 资源限制:检查是否有足够的资源可用来运行 CoreDNS Pod。如果 Pod 的资源限制过低,可能会导致崩溃。你可以通过调整 Pod 的资源请求和限制来解决此问题。 5. 重启 Pod:如果以上步骤都没有解决问题,你可以尝试删除并重新创建 CoreDNS Pod。使用以下命令删除 Pod: ``` kubectl delete pod <pod-name> -n <namespace> ``` Kubernetes 将自动重新创建 Pod,并尝试修复任何错误。 如果问题仍然存在,可能需要进一步排查 CoreDNS 配置、Kubernetes 集群的状态以及其他相关组件的问题

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值