在离线统一调度器 Gödel Scheduler 性能优化: 算法设计思想与数据结构应用

字节跳动开源

于 2024-09-26 14:41:23 发布

阅读量872

点赞数 29

分类专栏： KubeWharf 文章标签：性能优化算法数据结构开源云原生 kubernetes

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bytedanceospo/article/details/142555314

版权

基于优异的调度性能，Gödel Scheduler 拥有在超大集群规模 (20k+ Nodes, 1000k+ Pods)、超高业务负载 (1k+ Incoming Pods/s)、超多复杂场景 (ML/批流/潮汐混部等) 下长期稳定运行的能力。

来源 | KubeWharf 社区

项目 | github.com/kubewharf/godel-scheduler

Gödel Scheduler 是字节跳动开源的在离线统一调度器，旨在使用同一套调度器来统一调度和管理在离线业务，实现资源并池，从而在提升资源利用率和资源弹性的同时，优化业务成本和体验，降低运维压力。

当前，Gödel Scheduler 的单分片调度吞吐可达 2500+ Pods/s (10x Kube Scheduler)，多分片调度吞吐可达 5000+ Pods/s，这离不开大量创造性的构思。

本文将以几个经典优化为例，阐述基于这些构思所衍生的算法设计思想与数据结构应用，说明其对提升 Gödel Scheduler 调度性能并最终解决实际问题所发挥的巨大作用。

设计一：增量更新

前置介绍

与 Kube Scheduler 相似，Gödel Scheduler 同样维护了 In Memory 的 Cache 与 Snapshot。

Cache:

维护各类 Resource Object 的组织关系，有助于快速获得汇聚信息 (如节点已被使用的资源总量)，提高调度算法的执行效率
会伴随着 Event 触发实时变动，且数据维护需要对整个 Cache 加锁

Snapshot:

规避当前调度轮次期间 Event 带来的影响，保证调度过程中的数据一致性
单个调度轮次期间数据只读，不需要加锁

每次调度流程的起始都需要将 Cache 的最新数据同步 Clone 到 Snapshot 中供串行的调度流程取用，因此数据同步的效率就格外关键。

问题产生与解决

相比于 Kube Scheduler，Gödel Scheduler 拥有更复杂的调度功能、需要承载更大规模的集群与应用，并由此带来了更多种类的缓存信息与更大量级的数据同步规模。此前，伴随着业务上量与集群规模自然增长，大量生产集群都频繁出现了各类缓存信息全量克隆所产生的性能问题，并严重拖垮了调度吞吐与调度时延。

最低0.47元/天解锁文章

字节跳动开源

博客等级

码龄1年

42
原创

768
点赞

649
收藏

415
粉丝

关注

私信

热门文章

分类专栏

最新评论

无文本编码器仍能媲美CLIP！豆包大模型团队首创SuperClass模型
π_π67: 有没有预训练模型可以用啊
字节跳动开源多云多集群管理引擎 KubeAdmiral v1.0.0 发布！
BOYFINDGF: 行业人一看就知道是抄袭了华为Karmada，连很多宣发文案和内部概念都完全一样。有这时间和本事，为啥不加入Karmada共建呢
字节跳动下一代通用高性能 OneAgent
CSDN-Ada助手: 恭喜您发布了第10篇博客！看到您分享关于字节跳动下一代通用高性能 OneAgent的内容，让人眼前一亮。希望您能继续保持创作的热情和积极性，为读者带来更多有价值的信息。或许在未来的创作中，可以深入探讨该技术的应用场景及实际案例，让读者更加深入地了解其优势和特点。期待您的下一篇作品！
字节跳动开源 Gödel Scheduler：在离线统一调度器
CSDN-Ada助手: 恭喜您发布了第7篇博客，看到您分享关于字节跳动开源 Gödel Scheduler 的内容，让人不禁对该调度器的功能和性能产生了浓厚的兴趣。希望您能继续坚持创作，为大家带来更多有价值的内容。接下来，或许可以深入分析该调度器的应用场景和实际效果，让读者更加全面地了解其优势所在。期待您的下一篇作品！
自回归超越扩散！北大、字节 VAR 范式解锁视觉生成 Scaling Law
CSDN-Ada助手: 恭喜作者在博客领域持续创作，标题中提到的自回归超越扩散和北大、字节 VAR 范式解锁视觉生成 Scaling Law听起来非常引人注目！希望作者可以继续深挖这一领域的研究，为读者带来更多有见地的观点和研究成果。也许可以考虑探讨一下这些理论对实际应用的启示，或者深入探讨一些相关领域的前沿研究，让读者对该领域的发展有更全面的了解。期待作者未来更多精彩的作品！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。