-
简介
为了解决 Yarn 中 ResourceManager 的单点故障问题,在 Hadoop 2.4 中新增了 ResourceManager HA 的能力, 该文章基于 Hadoop 3.1.1 进行讲解。
1.1. 名词定义
全称 | 简称 | 备注 |
ResourceManager | Rm | |
Zookeeper | ZK |
-
ResourceManager Ha 架构
ResourceManager HA 是基于 Active/Standby 架构形态,在集群中任意时刻最多只能有一个 Active 状态的 Rm 一个或多个 Standby 状态的 Rm,当 Active RM 故障时会基于 Zookeeper Watcher 机制从 Standby 状态的 Rm 中选取出一个 Rm 进行接管实现自动的故障转移。
-
ResourceManager 启用 HA
在 yarn-site.xml 新增以下配置并分发重启 Yan 集群即可重启 ResourceManager HA
配置名称 | 默认值 | 配置描述 | |
hadoop.zk.address |