YARN资源调度器

博学谷提供支持

集群资源是非常有限的,在多用户、多任务环境下,如何保证在有限资源或业务约束下有序调度和执行任务,需要有一个协调者,这就是YARN资源调度器。

YARN所有的资源调度器均实现Resource Scheduler接口,因此是一个插拔式组件。

用户可以自己通过配置参数来配置不同的调度器,也可以按照接口规范来编写一个新的资源调度器,通过简单的配置,使它运行起来。

默认情况下,YARN采用的是Capacity Scheduler调度器。

从另一个角度看,YARN资源调度器是一个事件处理器,由外部事件触发驱动,它需要处理来自外部的Scheduler Event Type类型事件。

这类事件总共有6个,分别是NODE_ADDED(添加一个计算节点)、NODE_REMOVED(移除一个计算结点)、APPLICATION_ADDED(添加一个应用程序)、APPLICATION_REMOVED(移除一个应用程序)、CONTAINER_EXPIER(回收超时的Container)、NODE_UPDATE(更新节点)。

其中NODE_UPDATE是最重要的,NodeManager通过心跳机制向ResourceManager汇报信息会触发NODE_UPDATE事件,因为此时可能有Container得到释放,因此该事件会触发资源分配。
下面是YARN自带的Capacity Scheduler和Fair Scheduler的介绍及配置说明。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Hadoop YARN是Hadoop的下一代集群资源管理系统,它将集群资源划分为容,通过资源调度来分配和管理这些容资源调度的配置对于集群的性能和资源利用率至关重要。 首先,需要配置YARN调度类型。目前YARN支持两种调度:容量调度和公平调度。容量调度将集群资源按比例分配给不同的队列,每个队列有固定的资源容量;而公平调度资源动态分配给各个应用程序,根据应用程序的运行状况动态调整资源分配。 其次,需要配置队列的属性。队列属性包括队列名称、资源容量、资源限制等。资源容量指定了每个队列可以使用的最大资源数量,资源限制是为了避免某个队列占用过多资源而导致其他队列无法正常运行。 另外,还可以配置调度的策略。调度策略根据不同的需求来决定资源的分配方式,比如公平策略会尽量保持各个应用程序获得相同的资源量,而容量策略则会按照预先设定的比例分配资源。 此外,还需要配置队列的优先级。队列优先级可以保证某个队列在资源不足时获得更多的资源,以确保高优先级的应用程序能够正常运行。 最后,还可以配置一些其他参数,例如最大容数、最大AM资源比例等。这些参数可以根据具体的需求进行调整,以优化资源管理和调度效果。 总之,Hadoop YARN资源调度的配置需要根据集群的实际情况和需求进行灵活的调整,以实现高效的资源管理和调度

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值