Pod 一直处于 Pending 状态

年少7

已于 2023-08-30 15:25:17 修改

阅读量7.9k

点赞数 7

分类专栏： K8s 文章标签：运维

于 2022-04-26 19:06:24 首次发布

本文链接：https://blog.csdn.net/weixin_56477161/article/details/124434273

版权

文章目录

一现象描述
二可能原因
三排查方法

一现象描述

当 Pod 一直处于 Pending 状态时，说明该 Pod 还未被调度到某个节点上，需查看 Pod 分析问题原因。例如执行 kubectl describe pod 命令，则获取到的事件信息如下：

$ kubectl describe pod tikv-0
...
Events:
  Type     Reason            Age                 From               Message
  ----     ------            ----                ----               -------
  Warning  FailedScheduling  3m (x106 over 33m)  default-scheduler  0/4 nodes are available: 1 node(s) had no available volume zone, 2 Insufficient cpu, 3 Insufficient memory.

二可能原因

节点资源不足
不满足 nodeSelector 与 affinity
Node 存在 Pod 没有容忍的污点
低版本 kube-scheduler 的 bug
kube-scheduler 未正常运行
驱逐后其他可用节点与当前节点的有状态应用不在相同可用区

三排查方法

3.1 检查节点是否资源不足

3.1.1 问题分析

节点资源不足有以下几种情况：

CPU 负载过高。
剩余可以被分配的内存不足。
剩余可用 GPU 数量不足（通常在机器学习场景、GPU 集群环境

最低0.47元/天解锁文章

年少7

关注

7
点赞
踩
22

收藏

觉得还不错? 一键收藏
0
评论
Pod 一直处于 Pending 状态

对于已挂载了磁盘的 Pod，通常需要被调度到与当前故障节点和挂载磁盘所处同一个可用区的新的节点上。如果该值小于 Pod 的 Request，则不满足 Pod 的资源要求，Scheduler 在 Predicates（预选）阶段就会剔除掉该 Node，不会调度 Pod 到该 Node。在新增节点时，首先为该节点添加==node.cloudprovider.kubernetes.io/uninitialized ==污点，待节点初始化成功后再自动移除此污点，以避免 Pod 被调度到未初始化好的节点。
复制链接

扫一扫