集群关系图:
说明: 为了更加通俗的说明,笔者将两台运行 resourcemanager 进程的主机名抽象为 RM1 和 RM2,笔者更倾向 RM1 上的运行的是 active 状态的 resourcemanager 进程,RM2 上的运行的是 standby 状态的 resourcemanager 进程,而实际操作中,master5 就是这个 RM1 ,master52 就是这个 RM2。
抽象主机名 | 实际操作主机名 | 初始状态 | 理想稳定状态 | ha-id |
---|---|---|---|---|
RM1 | master5 | active | active | rm1 |
RM2 | master52 | standby | standby | rm2 |
其中关于 ha-id 是在 yarn-site.xml 配置文件中设置的。
hadoop也为管理员提供了 CLI 的方式管理 RM HA,但在没有启用 HA 的情况下,也就是在 yarn-site.xml 配置文件中没有设置 yarn.resourcemanager.ha.enabled
为 true 时 (默认为false,不启用),下面的命令是不可用的。
获得当前 RM 的 active 和 standby 状态
yarn rmadmin -getServiceState rm1
yarn rmadmin -getServiceState rm2
原文引用:https://blog.csdn.net/u011414200/article/details/50336735