一是必须要保证这两个 Namenode 的元数据信息必须要同步的
一:元数据信息同步在HA中使用的方案是共享存储,就是说每次写文件时,将日志同步写入到共享储存,这个步骤成功才能判定写文件成功,以便主备切换
二是一个 Namenode 挂掉之后 另一个要立马补上
二:监控集群状态使用zookeeper,两个节点的状态注册在zookeeper中,Namenode 节点进程监控实时读取zookeeper中的Namenode 状态,如果standby的Namenode 的ZKFC发现主节点的Namenode 挂掉了,那么就会给它发送强制关闭请求,之后将standby的Namenode 设置为active
有问题请指出,随时更新补充