Hadoop：YARN集群中资源管理器RM的高可用HA配置

最新推荐文章于 2024-05-17 04:54:47 发布

瞧德

最新推荐文章于 2024-05-17 04:54:47 发布

阅读量1.2k

点赞数

分类专栏： Hadoop 文章标签： hadoop yarn

本文链接：https://blog.csdn.net/qq_39192827/article/details/91684850

版权

本文详细介绍了在Hadoop YARN集群中配置资源管理器RM高可用的重要性以及实施步骤。当活动RM失败时，备用RM通过Zookeeper自动接管，确保作业和任务容器的连续运行。配置包括设置Zookeeper集群，更新YARN和MapReduce的配置文件，并启动额外的RM实例。在验证过程中，通过观察RM服务在不同节点间的无缝切换，证明了HA配置的成功。

摘要由CSDN通过智能技术生成

RM运行失败

资源管理器失败是个很严重的问题，这意味着作业和任务容器都将无法启动，默认情况下RM也是个单点故障。所以为了得到高可用性，运行一对RM是很有必要的。当活动RM失败了，备用RM通过zookeeper管理能自动顶替上。

所有运行中的应用的信息存储在一个高可用的状态存储区中（由ZK或HDFS备份），这样备用RM可以恢复失败的活动RM的关键状态，这与通过QJM实现namenode的高可用是类似的。而节点管理器NM信息不会存储在状态存储区中，因为当NM向刚启动的新RM发送第一个心跳时，NM的信息能以相当快递的速度在新的RM中重构。

备用的RM启动后，它会从状态存储区中读取所有应用的信息，然后为它们重启各自对应的Application Master。在活动RM故障时，客户和NM以轮询方式视图连接每一个RM，直到找到活动RM。

RM高可用配置

首先部署zookeeper集群，可参考Hadoop：使用QJM搭建HDFS高可用性(HA)集群及使用zookeeper自动故障转移

zookeeper进程运行在master1、slave2和slave3上

修改yarn-site.xml文件：

 <!-- 允许RM的高可用 -->
 <property>
   <name>yarn.resourcemanager.ha.enabled</name>
   <value>true</value>
 </property>

 <!-- 不能与当前存在的ID号相同 -->

最低0.47元/天解锁文章

瞧德

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录