android cpu调度策略_进击的Kubernetes调度系统（三）：支持批任务的Binpack Scheduling...

最新推荐文章于 2024-06-02 17:16:28 发布

牙医肖盼盼

最新推荐文章于 2024-06-02 17:16:28 发布

阅读量278

点赞数

文章标签： android cpu调度策略

本文链接：https://blog.csdn.net/weixin_32678427/article/details/112207504

版权

本文探讨了在Kubernetes集群中，如何通过Binpack策略减少资源碎片，提升GPU利用率。相较于默认的资源均衡策略，Binpack能更有效地填充节点资源，避免昂贵的GPU空闲。文章介绍了Binpack的实现方案，包括打分函数的构建和配置，以及实际场景中的Demo演示，展示了启用和未启用Binpack功能时的不同调度效果。

摘要由CSDN通过智能技术生成

前言

本系列的前两篇《进击的Kubernetes调度系统（一）：Scheduling Framework》和进击的 Kubernetes 调度系统（二）：支持批任务的 Coscheduling/Gang scheduling 分别介绍了Kubernetes Scheduling Framework和如何通过扩展Scheduling Framework实现Coscheduling/Gang scheduling调度策略。当我们的批任务作业在集群里边运行起来之后，随后要关注的就是资源的利用率。特别是对于GPU卡的价格昂贵，不希望有资源的浪费。本文将介绍在批任务的调度过程中如何通过Binpack的方式，减少资源碎片，提升GPU的利用率。

为什么需要Binpack功能？

Kubernetes默认开启的资源调度策略是LeastRequestedPriority，消耗的资源最少的节点会优先被调度，使得整体集群的资源使用在所有节点之间分配地相对均匀。但是这种调度策略往往也会在单个节点上产生较多资源碎片。

下面拿一个简单的例子来说明这种问题。如下图所示，资源在节点之间平均使用，所以每个节点使用3个GPU卡，则两个节点各剩余1GPU的资源。这是有申请2GPU的新作业，提交到调度器，则因为无法提供足够的资源，导致调度失败。

如上这种情况情况，每个节点都有1个GPU卡空闲，可是又无法被利用，导致资源GPU这种昂贵的资源被浪费。如果使用的资源调度策略是Binpack，优先将节点资源填满之后，再调度下一个节点，则上图所出现的资源碎片问题得到解决。申请2GPU的作业被正常调度到节点上，提升了集群的资源使用率。

实现方案

Binpack实现已经抽象成Kubernetes Scheduler Framework的Score插件RequestedToCapacityRatio，用于优选阶段给节点打分。将节点根据自己定义的配置进行打分。具体的实现可以分为两个部分，构建打分函数和打分.

构建打分函数

构建打分函数的过程比较容易理解，就是用户可以自己定义不同的利用率所对应的分值大小，以便影响调度的决策过程。
如果用户设定的对应方式如下所示，即如果资源利用率为0的时候，得分为0分，当资源利用率为100时，得分为10分，所以得到的资源利用率越高，得分越高，则这个行为是Binpack的资源分配方式。

最低0.47元/天解锁文章

牙医肖盼盼

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
android cpu调度策略_进击的Kubernetes调度系统（三）：支持批任务的Binpack Scheduling...

前言本系列的前两篇《进击的Kubernetes调度系统（一）：Scheduling Framework》和进击的 Kubernetes 调度系统（二）：支持批任务的 Coscheduling/Gang scheduling 分别介绍了Kubernetes Scheduling Framework和如何通过扩展Scheduling Framework实现Coscheduling/Gang sch...
复制链接

扫一扫