资源调度器的一些基本问题

最新推荐文章于 2022-12-14 09:58:42 发布

binling

最新推荐文章于 2022-12-14 09:58:42 发布

阅读量1.4k

点赞数

分类专栏：架构系统分析设计

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/binling/article/details/52959486

版权

系统分析设计同时被 2 个专栏收录

50 篇文章 0 订阅

订阅专栏

35 篇文章 0 订阅

订阅专栏

1 调度算法

Capacity based， DRF(dominant recourse fairness)，label based等

多态化，插件化，可以多种策略一起工作，对应于不同Job （优先级，job特性，service or batch job)

2 容错，HA

调度器一般处在一个中心位置，存在SPF问题。可以采用类似HDFS，JobTracker的HA方案

1）active - standby 结构，（standby 一般是一个，也可多个）

2）无状态（状态外化），使用可靠的外部shared storage保存状态（NFS，Bookeeper，Zookeeper）

3）状态的形式一般是 snapshot + read ahead log ( image + edits)

4) Fault Detect，具体方案有很多：

a) active 向 standby 心跳，超时standby take over

b) active向数据库心跳，standby 定时检查 active的 last heart beat time。

c) 基于全局锁，能获得锁的就是active

d) 基于的membership list通知

5）切换。standby 从shared storage恢复状态，VIP切换（或者不基于VIP，client liberary自己retry判断)

3 调度器的架构以及相应的scalability

调度器面对的是整个cluster的资源以及使用情况，这是一个全局的复合状态。最安全的架构就是串行化，job一个一个schedule。一般的架构就是单线程的。

1）Monolithic scheduler

就一个scheduer，面向整个资源

2）静态分区的scheduler

静态的把资源partition，每个scheduler负责一个partition的资源的调度，这样每个scheduler并行工作，彼此也无冲突。

3）双层调度架构

一个中心recourse allocator动态的给每个scheduler分配资源，方案二的动态化。通过资源锁实现，一个scheduler拥有一个资源就是拥有这个资源的锁。

缺点：

a）死锁的问题。

b）每个调度器只能看到部分资源，影响调度算法的效果

c ）较低的并发度

注：Yarn虽然形式上像双层架构，但本质上是单体的，因为第二层的ApplicationMaster的调度本质上是job管理，而非资源管理。

4）share state 调度器

每个scheduler都面向整个资源，基于乐观的并发机制（后验的并发）。适用于冲突较少的情况。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
资源调度器的一些基本问题

1 调度算法Capacity based， DRF(dominant recourse fairness)，label based等多态化，插件化，可以多种策略一起工作，对应于不同Job （优先级，job特性，service or batch job)2 容错，HA调度器一般处在一个中心位置，存在SPF问题。可以采用类似HDFS，JobTracker的HA方案1）act
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。