Kube Queue：Kubernetes 任务排队的利器

阿里云云栖号

于 2024-02-27 15:29:59 发布

阅读量1.5k

点赞数 20

分类专栏：云栖号技术分享文章标签： kubernetes 容器云计算阿里云云原生

本文链接：https://blog.csdn.net/yunqiinsight/article/details/136323902

版权

批处理作业（Batch Job）常应用于数据处理、仿真计算、科学计算和人工智能等领域，主要用于执行一次数据处理或模型训练任务。由于这类任务往往需要消耗大量计算资源，因此必须根据任务的优先级和提交者的可用资源情况进行合理排队，才能最大化集群资源的利用效率。

Scheduler 在任务调度领域水土不服

当前 Kubernetes 的调度器提供了完善的 Pod 通用调度功能，但是在面对大量任务排队时，依然暴露出了局限性：

缺少自动化的排队机制

默认情况下，批处理任务会直接创建作业 Pod，当集群可用资源不足时，大量 Pending Pod 会严重拖慢 Kubernetes 调度器的处理速度，影响在线业务扩容和调度。因此，迫切需要能够自动根据集群资源控制作业启停的自动化排队机制。

缺少多样化的排队策略

为提升任务排队效率，需要根据集群资源和任务规模，采取阻塞队列、优先级队列、回填调度等不同的排队策略。然而，Kubernetes 调度器的默认调度策略主要根据优先级和 Pod 创建顺序进行排队，难以应对多样化的任务排队需求。

缺少多队列能力

为隔离不同用户或租户的任务，避免资源被单一用户的大量任务占满，导致其它用户“饿死”，任务排队系统需要支持多队列管理，将不同用户提交的任务分配到不同队列中排队。目前，Kubernetes 调度器仅支持单一队列，无法有效避免此类问题。

大量任务类型难以统一

在机器学习、高性能计算、大数据计算和离线工作流等不同应用场景下，用户会提交不同类型的任务，每类任务对资源和优先级的计算方法都有所不同，将这些计算逻辑都集成到调度器中，必然大幅增加维护复杂性和运维成本。

因此，在处理复杂的任务调度场景时，云服务提供商通常不将原生 Kubernetes 调度器作为首选方案。

Queue 在 Kubernetes 中的定位与职责

在 Kubernetes 集群中，Queue 与 Scheduler 共同协作以确保任务的高效调度。为了避免“脑裂”等典型的分布式系统问题，必须清晰划分它们的职责。目前，Kubernetes 中的 Queue 可以分为两类：

第一类 Queue 与 Kubernetes 的 Scheduler 属于不同分层。Queue 负责任务的排序和按顺序出队，专注于任务的生命周期管理和实现更公平的用户间出队策略；Scheduler 负责任务 Pod 的合理编排，找到最优的放置策略，专注于节点亲和性、拓扑感知等方面。这类 Queue 不直接感知底层的物理信息，任务出队后可能会因为节点亲和性、资源碎片化等因素无法调度，导致队头阻塞。因此，这类队列通常需要引入“任务在无法调度时重新入