记一次 Centos7.x Hadoop 3.x 部署 YARN 集群及基本操作

一、操作目的:

1、如何搭建 YARN 分布式集群
2、使用 YARN 集群提交一些简单的任务

二、集群搭建:

集群搭建过程

三、客户端环境变量配置:

参考:Hadoop 3.x HDFS 写入文件 中 客户端环境变量配置

四、编辑文件 yarn-site.xml :

1、编辑文件

[root@master ~]# vim /usr/bigdata/hadoop-3.3.0/etc/hadoop/yarn-site.xml 

2、编辑内容

<configuration>
        <property>
                <name>yarn.resourcemanager.hostname</name>
                <value>master</value>
        </property>
        <property>
                <name>yarn.nodemanager.aux-services</name>
                <value>mapreduce_shuffle</value>
        </property>
</configuration>

3、把编辑后的文件发送给各个节点

[root@master ~]# scp /usr/bigdata/hadoop-3.3.0/etc/hadoop/yarn-site.xml root@slave1:/usr/bigdata/hadoop-3.3.0/etc/hadoop/
[root@master ~]# scp /usr/bigdata/hadoop-3.3.0/etc/hadoop/yarn-site.xml root@slave2:/usr/bigdata/hadoop-3.3.0/etc/hadoop/
[root@master ~]# scp /usr/bigdata/hadoop-3.3.0/etc/hadoop/yarn-site.xml root@slave3:/usr/bigdata/hadoop-3.3.0/etc/hadoop/

4、修改 YARN 的启动和关闭脚本

[root@master ~]# vim /usr/bigdata/hadoop-3.3.0/sbin/start-yarn.sh
[root@master ~]# vim /usr/bigdata/hadoop-3.3.0/sbin/stop-yarn.sh
[root@master ~]# vim /usr/bigdata/hadoop-3.3.0/bin/yarn

5、在前面加上以下内容

YARN_RESOURCEMANAGER_USER=root
HADOOP_SECURE_DN_USER=root
YARN_NODEMANAGER_USER=root

6、把编辑后的两个文件分别发送给各个节点

[root@master ~]# scp /usr/bigdata/hadoop-3.3.0/bin/yarn root@slave1:/usr/bigdata/hadoop-3.3.0/bin
[root@master ~]# scp /usr/bigdata/hadoop-3.3.0/bin/yarn root@slave2:/usr/bigdata/hadoop-3.3.0/bin
[root@master ~]# scp /usr/bigdata/hadoop-3.3.0/bin/yarn root@slave3:/usr/bigdata/hadoop-3.3.0/bin
[root@master ~]# scp /usr/bigdata/hadoop-3.3.0/sbin/start-yarn.sh root@slave1:/usr/bigdata/hadoop-3.3.0/sbin
[root@master ~]# scp /usr/bigdata/hadoop-3.3.0/sbin/start-yarn.sh root@slave2:/usr/bigdata/hadoop-3.3.0/sbin
[root@master ~]# scp /usr/bigdata/hadoop-3.3.0/sbin/start-yarn.sh root@slave3:/usr/bigdata/hadoop-3.3.0/sbin
[root@master ~]# scp /usr/bigdata/hadoop-3.3.0/sbin/stop-yarn.sh root@slave1:/usr/bigdata/hadoop-3.3.0/sbin
[root@master ~]# scp /usr/bigdata/hadoop-3.3.0/sbin/stop-yarn.sh root@slave2:/usr/bigdata/hadoop-3.3.0/sbin
[root@master ~]# scp /usr/bigdata/hadoop-3.3.0/sbin/stop-yarn.sh root@slave3:/usr/bigdata/hadoop-3.3.0/sbin

7、启动服务

[root@master ~]# /usr/bigdata/hadoop-3.3.0/sbin/start-yarn.sh

在这里插入图片描述
8、查看各个节点的启动状态
在这里插入图片描述

五、浏览器查看 YARN 服务的 WEB 页面

浏览器地址栏录入 http://192.168.11.21:8088/ 说明:192.168.11.21 是 Resourcemanager 所在节点的 IP
效果入下图在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

六、在客户端节点上提交 Distributedshell 任务

1、提交 Distributedshell 任务

[root@slave2 ~]# /usr/bigdata/hadoop-3.3.0/bin/yarn org.apache.hadoop.yarn.applications.distributedshell.Client -jar /usr/bigdata/hadoop-3.3.0/share/hadoop/yarn/hadoop-yarn-applications-distributedshell-3.3.0.jar -shell_command uptime

2、运行效果如下:
在这里插入图片描述
3、在 YARN 服务的 WEB 页面查看运行结果:
在这里插入图片描述
在这里插入图片描述

七、在客户端节点上提交 Mapreduce 类型的任务

1、查看 Hadoop 的 classpath 信息

[root@master ~]# hadoop classpath

2、打印信息如下

/usr/bigdata/hadoop-3.3.0/etc/hadoop:/usr/bigdata/hadoop-3.3.0/share/hadoop/common/lib/*:/usr/bigdata/hadoop-3.3.0/share/hadoop/common/*:/usr/bigdata/hadoop-3.3.0/share/hadoop/hdfs:/usr/bigdata/hadoop-3.3.0/share/hadoop/hdfs/lib/*:/usr/bigdata/hadoop-3.3.0/share/hadoop/hdfs/*:/usr/bigdata/hadoop-3.3.0/share/hadoop/mapreduce/*:/usr/bigdata/hadoop-3.3.0/share/hadoop/yarn:/usr/bigdata/hadoop-3.3.0/share/hadoop/yarn/lib/*:/usr/bigdata/hadoop-3.3.0/share/hadoop/yarn/*

3、编辑配置文件 mapred-site.xml

[root@master ~]# vim /usr/bigdata/hadoop-3.3.0/etc/hadoop/mapred-site.xml 

4、编辑如下内容

<configuration>
        <property>
                <name>mapreduce.framework.name</name>
                <value>yarn</value>
        </property>
        <property>
	        <name>yarn.application.classpath</name>
	        <value>/usr/bigdata/hadoop-3.3.0/etc/hadoop:/usr/bigdata/hadoop-3.3.0/share/hadoop/common/lib/*:/usr/bigdata/hadoop-3.3.0/share/hadoop/common/*:/usr/bigdata/hadoop-3.3.0/share/hadoop/hdfs:/usr/bigdata/hadoop-3.3.0/share/hadoop/hdfs/lib/*:/usr/bigdata/hadoop-3.3.0/share/hadoop/hdfs/*:/usr/bigdata/hadoop-3.3.0/share/hadoop/mapreduce/*:/usr/bigdata/hadoop-3.3.0/share/hadoop/yarn:/usr/bigdata/hadoop-3.3.0/share/hadoop/yarn/lib/*:/usr/bigdata/hadoop-3.3.0/share/hadoop/yarn/*</value>
		</property>
</configuration>

5、把编辑后的 mapred-site.xml 文件发送给各个节点

[root@master ~]# scp /usr/bigdata/hadoop-3.3.0/etc/hadoop/mapred-site.xml root@slave1:/usr/bigdata/hadoop-3.3.0/etc/hadoop/
[root@master ~]# scp /usr/bigdata/hadoop-3.3.0/etc/hadoop/mapred-site.xml root@slave2:/usr/bigdata/hadoop-3.3.0/etc/hadoop/
[root@master ~]# scp /usr/bigdata/hadoop-3.3.0/etc/hadoop/mapred-site.xml root@slave3:/usr/bigdata/hadoop-3.3.0/etc/hadoop/

6、重新启动 YARN 的服务

[root@master ~]# /usr/bigdata/hadoop-3.3.0/sbin/stop-yarn.sh
[root@master ~]# /usr/bigdata/hadoop-3.3.0/sbin/stop-dfs.sh
[root@master ~]# /usr/bigdata/hadoop-3.3.0/sbin/start-dfs.sh
[root@master ~]# /usr/bigdata/hadoop-3.3.0/sbin/start-yarn.sh

7、提交 PI Estimator 任务

[root@slave1 ~]# /usr/bigdata/hadoop-3.3.0/bin/hadoop jar /usr/bigdata/hadoop-3.3.0/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.0.jar pi 2 10

命令最后两个参数的含义:2 运行两次;10 每个 map 的任务;两个数相乘就是取样数
Mapreduce 运行过程及结果:
在这里插入图片描述
在这里插入图片描述
8、在 YARN 服务的 WEB 页面查看运行结果:
在这里插入图片描述

八、扩展:

重启 YARN 服务也可以这样执行

[root@master ~]# yarn --daemon stop resourcemanager
[root@master ~]# yarn --daemon stop nodemanager
[root@master ~]# yarn --daemon start resourcemanager
[root@master ~]# yarn --daemon start nodemanager

至此 Centos7.x Hadoop 3.x 部署 YARN 集群及基本操作完毕,希望能够对您有所帮助!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值