Capacity Scheduler

CapacityScheduler是Hadoop的一个可插拔调度器,旨在实现多用户集群的安全共享。它保障各组织的资源容量,并通过层级队列实现资源的公平分配,提高集群利用率。该调度器通过限制防止单个应用或用户过度消耗资源,确保集群稳定。组织可以在不影响SLA的前提下,利用未被充分利用的容量,实现成本效益的弹性资源使用。
摘要由CSDN通过智能技术生成

博学谷提供支持

Capacity Scheduler是由Yahoo贡献的,是Hadoop上一个可插拔式的调度器,它允许多用户安全地共享一个大型的集群,能够在分配的容量限制下,及时地为用户的应用程序分配资源。

Capacity Scheduler用来设计运行Hadoop应用程序,使之成为一个共享的、操作友好的、多用户的集群。同时,最大化集群的吞吐率和利用率。

传统上,每个组织都有它们自己私有的一组机器资源,有充足的能力来满足在峰值或接近峰值时的资源需求。这通常导致较差的资源利用率和多个独立集群(每个组织一个)的管理开销。

各个组织之间共享集群是非常有效益的一种运行Hadoop的方式,因为这让他们不用创建私有集群便可享受有规模的服务。

但各个组织比较关心共享集群的方式,因为他们担心别人占用关乎自己SLA(服务级别协议)的资源。

因此Capacity Scheduler设计成给每个组织容量保证的同时共享一个大的集群。它的核心思想是:多个组织根据他们的计算需求大小,共同投资建设集群,然后根据投资的多少共享Hadoop集群中的可用资源。

还有一个额外的好处,一个组织可以访问别人没有使用的额外的容量,从而提供一个符合成本效益的弹性组织方式。

跨组织共享集群,需要多个组织的用户的大力支持,因为每一个组织必须保证容量和安全防范,以确保共享的集群不受单个应用程序或用户的影响。

Capacity Scheduler提供了一套严格的限制以确保单个应用程序、用户或队列不会消耗不合比例的集群资源。

此外,Capacity Scheduler提供了初始化/挂起一个用户或者队列的应用程序的限制,以确保集群的公平与稳定。

Capacity Scheduler最重要的一个抽象概念是队列,队列一般是由管理员建立来反应集群的分配的。

为了提供对共享资源的进一步的控制和预测,Capacity Scheduler支持层级队列,可以保证资源在一个队列的子队列中优先于其他队列来获取到空闲的资源,从而提供了在一个组织内部各应用程序间共享资源的密切关系。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值