案例:YARN多资源队列配置和使用
我们的需求是这样的,希望增加2个队列,一个是online队列,一个是offline队列
然后向offline队列中提交一个mapreduce任务
online队列里面运行实时任务
offline队列里面运行离线任务,我们现在学习的mapreduce就属于离线任务
实时任务我们后面会学习,等讲到了再具体分析。
这两个队列其实也是我们公司中最开始分配的队列,不过随着后期集群规模的扩大和业务需求的增加,后期又增加了多个队列。
在这里我们先增加这2个队列,后期再增加多个也是一样的。
具体步骤如下:
修改集群中etc/hadoop目录下的capacity-scheduler.xml配置文件
修改和增加以下参数,针对已有的参数,修改value中的值,针对没有的参数,则直接增加
这里的default是需要保留的,增加online,offline,这三个队列的资源比例为7:1:2
具体的比例需要根据实际的业务需求来,看你们那些类型的任务比较多,对应的队列中资源比例就调高一些,我们现在暂时还没有online任务,所以我就把online队列的资源占比设置的小一些。
先修改bigdata01上的配置
[root@bigdata01
本文档详细介绍了如何配置和使用Hadoop YARN的多资源队列,包括创建online和offline队列,调整资源比例,并通过示例展示了如何指定任务提交到特定队列,以及查看队列中任务的执行情况。这对于管理和优化集群资源分配至关重要。
订阅专栏 解锁全文
635

被折叠的 条评论
为什么被折叠?



