Hadoop 2.4.0版本开始,Yarn 实现了 ResourceManager HA
由于资源使用情况和 NodeManager 信息都可以通过 NodeManager 的心跳机制重新构建出来,因此只需要对 ApplicationMaster 相关的信息进行持久化存储即可。
在一个典型的 HA 集群中,两台独立的机器被配置成 ResourceManger。在任意时间,有且只允许一个活动的.ResourceManger,另外一个备用。切换分为两种方式:
手动切换
:在自动恢复不可用时,管理员可用手动切换状态,或是从 Active 到 Standby,或是
从 Standby 到 Active。
自动切换
:基于 Zookeeper,但是区别于 HDFS 的HA,2 个节点间无需配置额外的
ZFKC
守护进程来同步数据。在这里提一下ZKFC,(
ZKFC: 是线程,只作为RM进程的一个线程而非独立的进程存在
)