hadoop 高级 | hadoop队列管理与资源隔离

本文详细介绍了Hadoop中CapacityScheduler的配置与使用,包括队列的创建、属性设置、任务优先级调整以及如何在Hive等组件中应用队列管理。重点讨论了队列的容量保证、安全性和弹性,并提供了配置示例。
摘要由CSDN通过智能技术生成

  • 功能点
  • 配置
    • 配置ResouceManager使用CapacityScheduler
    • 设置队列
    • 队列属性
    • 队列属性配置
    • 修改配置文件
    • 设置任务的优先级
  • 其他组件使用hadoop队列
    • Hive
  • 补充
  • 参考

功能点

  • Hierarchical Queues(队列可分层)
  • Capacity Guarantees
  • Security(安全性)
  • Elasticity
  • Multi-tenancy
  • Operability
  • Resource-based Scheduling
  • Queue Mapping based on User or Group: 可以基于用户或用户组分配队列;
  • Priority Scheduling(优先级):

配置

配置ResouceManager使用CapacityScheduler

修改conf/yarn-site.xml文件

属性
yarn.resourcemanager.scheduler.class org.apache.hadoop.yarn.server.resourcemanager.scheduler.capacity.CapacityScheduler

设置队列

修改capacity-scheduler.xml配置文件.

属性
yarn.scheduler.capacity.root.queues default, batch
  <property>
    <name>yarn.scheduler.capacity.root.queues</name>
    <value>default,batch</value>
    <description>The queues at the this level (root is the root queue).</description>
  </property>

其中默认有default队列,现添加queues11队列。

队列属性

  • yarn.scheduler.capacity.root.default.capacity:一个百分比的值,表示占用整个集群的百分之多少比例的资源,这个queue-path下所有的capacity之和是100
  • yarn.scheduler.capacity.root.default.user-limit-factor:每个用户的低保百分比,比如设置为1,则表示无论有多少用户在跑任务,每个用户占用资源最低不会少于1%的资源
  • yarn.scheduler.capacity.root.default.maximum-capacity:
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值