进击的Kubernetes调度系统（三）：支持批任务的Binpack Scheduling

最新推荐文章于 2024-08-11 23:53:25 发布

阿里巴巴中间件

最新推荐文章于 2024-08-11 23:53:25 发布

阅读量1.6k

点赞数 2

分类专栏：互联网工作效率文章标签：阿里云效率

本文链接：https://blog.csdn.net/weixin_39860915/article/details/108082920

版权

本文探讨了Kubernetes中通过Binpack策略提高GPU利用率的问题，以解决资源碎片导致的浪费。介绍了Binpack的实现原理，包括构建打分函数和打分过程，并展示了在实际批任务调度中的应用和效果，旨在优化GPU资源分配。

摘要由CSDN通过智能技术生成

作者：

王庆璨：阿里云技术专家，专注于大规模集群资源管理和调度。Kubernetes社区成员，主要参与Kube-scheduler社区开发。目前负责阿里云容器服务ACK资源调度和云原生AI相关工作。

张凯：阿里云高级技术专家，从事容器服务ACK 和云原生AI解决方案的研发和客户支持。拥有10余年大规模深度学习平台，云计算，SOA等领域经验。

往期回顾：

进击的Kubernetes调度系统（一）：Scheduling Framework

进击的Kubernetes调度系统（二）：支持批任务的Coscheduling/Gang scheduling

前言

本系列的前两篇《进击的Kubernetes调度系统（一）：Scheduling Framework》和进击的 Kubernetes 调度系统（二）：支持批任务的 Coscheduling/Gang scheduling 分别介绍了Kubernetes Scheduling Framework和如何通过扩展Scheduling Framework实现Coscheduling/Gang scheduling调度策略。当我们的批任务作业在集群里边运行起来之后，随后要关注的就是资源的利用率。特别是对于GPU卡的价格昂贵，不希望有资源的浪费。本文将介绍在批任务的调度过程中如何通过Binpack的方式，减少资源碎片，提升GPU的利用率。