- 功能点
- 配置
- 配置ResouceManager使用CapacityScheduler
- 设置队列
- 队列属性
- 队列属性配置
- 修改配置文件
- 设置任务的优先级
- 其他组件使用hadoop队列
- Hive
- 补充
- 参考
功能点
- Hierarchical Queues(队列可分层)
- Capacity Guarantees
- Security(安全性)
- Elasticity
- Multi-tenancy
- Operability
- Resource-based Scheduling
- Queue Mapping based on User or Group: 可以基于用户或用户组分配队列;
- Priority Scheduling(优先级):
配置
配置ResouceManager使用CapacityScheduler
修改conf/yarn-site.xml
文件
属性 | 值 |
---|---|
yarn.resourcemanager.scheduler.class | org.apache.hadoop.yarn.server.resourcemanager.scheduler.capacity.CapacityScheduler |
设置队列
修改capacity-scheduler.xml
配置文件.
属性 | 值 |
---|---|
yarn.scheduler.capacity.root.queues | default, batch |
<property>
<name>yarn.scheduler.capacity.root.queues</name>
<value>default,batch</value>
<description>The queues at the this level (root is the root queue).</description>
</property>
其中默认有default队列,现添加queues11队列。
队列属性
- yarn.scheduler.capacity.root.default.capacity:一个百分比的值,表示占用整个集群的百分之多少比例的资源,这个queue-path下所有的capacity之和是100
- yarn.scheduler.capacity.root.default.user-limit-factor:每个用户的低保百分比,比如设置为1,则表示无论有多少用户在跑任务,每个用户占用资源最低不会少于1%的资源
- yarn.scheduler.capacity.root.default.maximum-capacity: