论文阅读笔记 - Omega: flexible,scalable schedulers for large compute clusters

彩色蚂蚁

于 2013-06-20 10:50:09 发布

阅读量4.2k

点赞数

分类专栏：大数据论文和项目解读文章标签： omega google scheduler

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/colorant/article/details/9135071

版权

大数据论文和项目解读专栏收录该内容

36 篇文章

订阅专栏

作者：刘旭晖 Raymond 转载请注明出处

Email：colorant at 163.com

BLOG：http://blog.csdn.net/colorant/

更多论文阅读笔记 http://blog.csdn.net/colorant/article/details/8256145

关键字

集群调度

== 目标问题 ==

在大规模的集群中，为了充分利用硬件资源，通常会将各种类型(CPU密集，IO密集，批量处理，低延迟等等)的workloads运行在同一台机器上，同时随着集群规模的增大，需要调度的任务的规模也线性增大。该论文的目标是为这种应用场合提供一种能灵活适应各种类型的任务，可扩展的高性能的调度系统

== 核心思想 ==

Omega的核心设计目标包括：硬件资源的高利用率，用户定义调度策略，快速调度决策过程以及兼顾各种层面的公平调度

常见的调度方案大致可分为，中央集中式的调度框架，和两级式的调度框架如Mesos等，前者无论从调度规模还是调度策略的角度上来说，都很难进行扩展。后者在资源分配和并发度上受其资源可见性和锁机制的影响，也有很大的局限性。

Omega的方案是围绕着资源状态共享的思想，多个并发的调度进程以乐观锁的方式访问这些共享状态来获得调度框架的可扩展性。

== 实现 ==

在Omega中，全局所有的资源对于各个调度进程来说都是可见的，各调度进程都有一份资源状态的拷贝，以此为基础来调度资源，在准备好资源的调度方案以后，原子性的进行一次提交，对共享的资源状态进行修改，如果失败则重新调度。无论成功与否，都会对本地的资源状态进行更新。可以看到其调度效率的高低取决于冲突的概率。

其中，资源可以根据任务的优先级被抢占，各调度进程也可以决定是否占用部分资源等。

同时，由于没有中央调度进程的存在，不太可能实现绝对的公平调度，但是为了在一定程度满足公平调度的需求，各个调度进程可以配置最大可调度资源和任务的上限等

== 其它 ==

不知道Omega最后在Google内部的使用情况如何，个人理解在调度公平性，避免饥饿和减少冲突等方面需要更细化的方案和策略。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。