kubectl 启动失败容器的排查思路

今天碰到一个问题就是 使用kubectl之后容器并没有启动起来,而且没有任何报错

问了下佩东老哥,可以通过kubectl get 去获取到 pod的名字,然后 使用kubectl describe pod 去查询错误信息

kubectl get Deployment  -A |grep httpbin
kubectl get rs -A |grep httpbin

看下这个命令,这两个指令是做什么的呢?


和ReplicaSet介绍
  RC(ReplicationController)主要的作用就是用来确保容器应用的副本数始终保持在用户定义的副本数。即如果有容器异常退出,会自动创建新的Pod来替代;而如果异常多出来的容器也会自动回收Kubernetes
  官方建议使用RS(Replicaset)替代RC(ReplicationController)进行部署,RS跟RC没有本质的不同,只是名字不一样,并且RS支持集合式的 selector
 

deployment是对pods和ReplicaSet的定义,定义了pods和ReplicaSet的定义和实现方式等。

可以通过rs 或者 deployment + -A参数获得全部的信息,看到我们最近启动的pod 名字

然后使用

kubectl describe pod -n mytest

kubectl 就可以看到 我们最新部署的报错情况了

排查pod启动失败的问题,可以使用以下命令进行排查: 1. 使用命令 `kubectl get pods` 查看pod的状态,如果状态为 CrashLoopBackOff,说明pod启动失败。 2. 使用命令 `kubectl describe pods <pod-name> -n <namespace>` 查看pod的详细信息,包括错误信息。例如,如果错误信息显示为 "read-only file system error",则可能是由于文件系统只读导致的问题。 3. 检查容器的启动时间是否过长,可以通过调整容器的 `initialDelaySeconds` 参数来延迟探测容器的启动。如果容器还没完全启动就开始探测,可能会导致检查失败,然后pod会被kill并不断重启。另外,节点负载过高也可能导致pod启动失败,可以查看节点的负载情况。 4. 检查kubelet是否报错,可以使用命令 `kubectl describe pods <pod-name> -n <namespace>` 查看pod的事件,进而判断是否有kubelet报错。例如,若报错信息为 "OCI runtime create failed: container_linux.go:348: starting container process caused "process_linux.go:301: running exec setns process for init caused \"signal: killed\"": unknown",则可能是拉取镜像失败导致的问题。 5. 如果pod的状态为 Pending,说明pod还没有调度到某个节点上。可以使用命令 `kubectl describe pods <pod-name> -n <namespace>` 查看pod的事件,进而判断为什么没有调度。例如,Events中可能会显示 "FailedScheduling",并给出具体的原因,如 "0/4 nodes are available: 2 Insufficient cpu",表示节点资源不足。 通过以上命令和步骤,可以帮助你排查pod启动失败的问题,并找到解决方案。<span class="em">1</span><span class="em">2</span><span class="em">3</span><span class="em">4</span>
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值