Hadoop快速入门系列(9) | 搭建YARN-HA集群

最新推荐文章于 2024-03-17 14:35:51 发布

SuperBigData~

最新推荐文章于 2024-03-17 14:35:51 发布

阅读量178

点赞数

分类专栏：四.大数据生态圈

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Jackson_mvp/article/details/103321054

版权

四.大数据生态圈专栏收录该内容

10 篇文章 0 订阅

订阅专栏

0）环境准备

（1）修改IP

（2）修改主机名及主机名和IP地址的映射

（3）关闭防火墙

（4）ssh免密登录

（5）安装JDK，配置环境变量等

（6）配置Zookeeper集群

1）规划集群

hadoop102 hadoop103 hadoop104

NameNode NameNode

JournalNode JournalNode JournalNode

DataNode DataNode DataNode

ZK ZK ZK

ResourceManager ResourceManager

NodeManager NodeManager NodeManager

2）具体配置

（1）yarn-site.xml

<configuration>

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<property>

<name>yarn.resourcemanager.ha.enabled</name>

<value>true</value>

</property>

<property>

<name>yarn.resourcemanager.cluster-id</name>

<value>cluster-yarn1</value>

</property>

<property>

<name>yarn.resourcemanager.ha.rm-ids</name>

<value>rm1,rm2</value>

</property>

<property>

<name>yarn.resourcemanager.hostname.rm1</name>

<value>bigdata111</value>

</property>

<property>

<name>yarn.resourcemanager.hostname.rm2</name>

<value>bigdata112</value>

</property>

<property>

<name>yarn.resourcemanager.zk-address</name>

<value>bigdata111:2181,bigdata112:2181,bigdata113:2181</value>

</property>

<property>

<name>yarn.resourcemanager.recovery.enabled</name>

<value>true</value>

</property>

<property>

<name>yarn.resourcemanager.store.class</name> <value>org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore</value>

</property>

</configuration>

（2）同步更新其他节点的配置信息

3）启动hdfs

（1）在各个JournalNode节点上，输入以下命令启动journalnode服务：

      sbin/hadoop-daemon.sh start journalnode

（2）在[nn1]上，对其进行格式化，并启动：

       bin/hdfs namenode -format

       sbin/hadoop-daemon.sh start namenode

（3）在[nn2]上，同步nn1的元数据信息：

  bin/hdfs namenode -bootstrapStandby

（4）启动[nn2]：

  sbin/hadoop-daemon.sh start namenode

（5）启动所有datanode

 sbin/hadoop-daemons.sh start datanode

（6）将[nn1]切换为Active

       bin/hdfs haadmin -transitionToActive nn1

4）启动yarn

（1）在bigdata112中执行：

sbin/start-yarn.sh

（2）在bigdata112中执行：

sbin/yarn-daemon.sh start resourcemanager

（3）查看服务状态

bin/yarn rmadmin -getServiceState rm1

恭喜搭建完成

拓展： HDFS Federation架构设计

NameNode架构的局限性

（1）Namespace（命名空间）的限制

由于NameNode在内存中存储所有的元数据（metadata），因此单个namenode所能存储的对象（文件+块）数目受到namenode所在JVM的heap size的限制。50G的heap能够存储20亿（200million）个对象，这20亿个对象支持4000个datanode，12PB的存储（假设文件平均大小为40MB）。随着数据的飞速增长，存储的需求也随之增长。单个datanode从4T增长到36T，集群的尺寸增长到8000个datanode。存储的需求从12PB增长到大于100PB。

（2）隔离问题

由于HDFS仅有一个namenode，无法隔离各个程序，因此HDFS上的一个实验程序就很有可能影响整个HDFS上运行的程序。

（3）性能的瓶颈

由于是单个namenode的HDFS架构，因此整个HDFS文件系统的吞吐量受限于单个namenode的吞吐量。

————保持饥饿，保持学习

Jackson_MVP

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

SuperBigData~ 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。