Hadoop Yarn-ResourceManager HA搭建

本文档详细介绍了如何在四台虚拟机上搭建Hadoop高可用(HA)集群,包括配置mapred-site.xml和yarn-site.xml文件,启动Zookeeper、Hadoop和YARN服务,以及在集群上运行自带的WordCount示例。同时,提供了停止集群的步骤,确保了资源管理器的高可用性和故障切换能力。
摘要由CSDN通过智能技术生成


模拟环境:四台虚拟机node1、node2、node3、node4

node1node2node3node4
NameNode-1NameNode-2
DataNode-1DataNode-2DataNode-3
Zookeeper-1Zookeeper-2Zookeeper-3
zkfc-1zkfc-2
JournalNode-1JournalNode-2JournalNode-3
ResourceManager-1ResourceManager-2
NodeManager-1NodeManager-2NodeManager-3

Hadoop HA 集群搭建

Hadoop HA 集群搭建的基础上进行搭建

1. 配置文件

mapred-site.xml

<configuration>
  <property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
  </property>
</configuration>

指定mr作业运行的框架:要么本地运行,要么使用MRv1,要么使用yarn

  • local (本地运行)
  • classic (使用MRv1,hadoop2.x之前)
  • yarn (使用yarn)

yarn-site.xml

<configuration>
  <!-- Site specific YARN configuration properties -->
  <!-- 让yarn的容器支持mapreduce的洗牌,开启shuffle服务 -->
  <property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
  </property>
  <!-- 启用resourcemanager的HA -->
  <property>
    <name>yarn.resourcemanager.ha.enabled</name>
    <value>true</value>
  </property>
  <!-- 给两个resourcemanager组成的HA命名 -->
  <property>
    <name>yarn.resourcemanager.cluster-id</name>
    <value>cluster1</value>
  </property>
  <!-- RM HA的两个resourcemanager的名字 -->
  <property>
    <name>yarn.resourcemanager.ha.rm-ids</name>
    <value>rm1,rm2</value>
  </property>
  <!-- 指定rm1的reourcemanager进程所在的主机名称 -->
  <property>
    <name>yarn.resourcemanager.hostname.rm1</name>
    <value>node3</value>
  </property>
  <!-- 指定rm2的reourcemanager进程所在的主机名称 -->
  <property>
    <name>yarn.resourcemanager.hostname.rm2</name>
    <value>node4</value>
  </property>
  <!-- 指定zookeeper集群的各个节点地址和端口号 -->
  <property>
    <name>yarn.resourcemanager.zk-address</name>
    <value>node2:2181,node3:2181,node4:2181</value>
  </property>
</configuration>

将两个配置文件拷贝到node2、node3、node4上

2. 启动

  1. 启动zookeeper集群
  2. 启动hadoop集群
  3. 启动yarn
    在node3(或node4)上执行命令:start-yarn.sh
    在node4(或node3)上执行命令:yarn-daemon.sh start resourcemanager

访问resourcemanager的web页面(默认端口8088):

http://node3:8088
在这里插入图片描述

http://node4:8088
在这里插入图片描述

3. 运行自带wordcount

  1. 生成数据文件

    for num in `seq 10000`; do echo "hello world $num" >> ~/wordcount.txt; done
    
  2. 将文件上传到hdfs

    hdfs dfs -put ~/wordcount.txt /user/root/wordcount.txt
    
  3. 运行wordcount

    cd $JAVA_HOME/share/hadoop/mapreduce
    hadoop jar hadoop-mapreduce-examples-2.6.5.jar wordcount  /user/root/wordcount.txt  /mr/wordcount/output
    
  4. 查看输出

    hdfs dfs -ls /mr/wordcount/output
    

    在这里插入图片描述

    hdfs dfs -cat /mr/wordcount/output/part-r-00000
    

4. 停止

在node3(或者node4)上执行:stop-yarn.sh

在node4(或者node3)上执行:yarn-deamon.sh stop resourcemanager

停止hadoop集群
停止zookeeper集群

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

theONLY0318

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值