1.针对容量调度器并发度低的问题,考虑调整
yarn.scheduler.capacity.maximum-am
resource-percent
该参数。默认值是
0.1
,表示集群上
AM
最多可使用的资源比例,目的为限
制过多的
app
数量。
(
1
)在
hadoop102
的
/opt/module/hadoop-3.1.3/etc/Hadoop/capacity-scheduler.xml
文件中
修改
如下参数值
(
2
)分发
capacity-scheduler.xml
配置文件
[atguigu@hadoop102 hadoop]$ xsync capacity-scheduler.xml
(
3
)关闭正在运行的任务,重新启动
yarn
集群
[atguigu@hadoop103 hadoop-3.1.3]$ sbin/stop-yarn.sh
[atguigu@hadoop103 hadoop-3.1.3]$ sbin/start-yarn.sh
2.配置
Yarn
容量调度器多队列
在企业里面如何配置多队列:
按照计算引擎创建队列
hive
、
spark
、
flink
按照业务创建队列:下单、支付、点赞、评论、收藏(用户、活动、优惠相关)
多队列有什么好处?
假如公司来了一个菜鸟,写了一个递归死循环,公司集群资源耗尽,大数据全部瘫痪。
可以使用队列统一管理任务优先级,保证重要的任务优先完成。
3.增加容量调度器队列
(
1
)修改容量调度器配置文件
默认
Yarn
的配置下,容量调度器只有一条
default
队列。在
capacity-scheduler.xml
中可
以配置多条队列,
修改
以下属性,增加
hive
队列。
同时为新加队列添加必要属性:


(
2
)分发配置文件
[atguigu@hadoop102 ~]$ xsync
/opt/module/hadoop-
3.1.3/etc/hadoop/capacity-scheduler.xml
(
3
)重启
Hadoop
集群
4.测试新队列
(
1
)提交一个
MR
任务,并指定队列为
hive
[atguigu@hadoop102 ~]$ hadoop jar /opt/module/hadoop-
3.1.3/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar pi
-
Dmapreduce.job.queuename=hive
1 1
(
2
)查看
ResourceManager
的
web
页面,观察任务被提交到的队列
5.
创建数据库
1
)启动
hive
[atguigu@hadoop102 hive]$ bin/hive
2
)显示数据库
hive (default)> show databases;
3
)创建数据库
hive (default)> create database gmall;
4
)使用数据库
hive (default)> use gmall;
6.datagrip
工具
793

被折叠的 条评论
为什么被折叠?



