图用了5版本的 6版本同样适用, 无变化
1.问题描述
在已启用HA的CDH集群中,误删Standby Namenode服务,导致集群异常,无法再次通过CM启用HA。异常如下
2.问题复现
1.一个健康集群并配置了HA
2.停止StandbyNameNode服务并删除
3.集群异常
4.再次通过CM启用HA
集群无法再次启用HA,问题复现。
3.解决方法
1.向集群添加一个新的NameNode和Failover Controller角色
新增NN角色
2.添加完成NN后集群异常如下
3.修改新增角色的配置如下
4.保存以上修改的配置后,回到CM主页
5.重启完成集群恢复正常