用Ambair部署HDP后,开启了NameNode HA模式,后来由于种种原因导致系统出了问题,需要停掉HA模式,并还原到最开始的NameNode和Secondary NameNode的模式。
这个Hortonworks的官方文档中详细描述了Roll Back的步骤,这里一定要注意版本,我一开始就是看错了版本导致后来有两步怎么都走不通。。如果你不是2.4.2的话,就去hortonworks的官方文档里找对应版本的手册。
由于我的情况比较复杂:先开启NameNode HA模式并成功运行(一个Active NameNode,一个Standby NameNode),后来突然有一天两个NameNode都Standby了,我在想是不是跑Standby NameNode的节点出问题了,就想着把NameNode迁移到另一个服务器上,通过ambari的web UI有个move namenode的功能,结果move总是失败。然而,虽然move失败了,却发现ambari UI上出现了三个NameNode,大概是移动的时候,一个节点上的NameNode没删干净,另一个节点上的NameNode没创建完全导致这个结果。这个时候我就找到了官方文档来roll back NameNode HA。
由于过程很纠结,所以按照上述文档中的步骤全部操作完成后,DataNode和NameNode都无法启动,HDFS直接挂掉。尝试多种方法后,最后终于找到一个方法:
1、仍然按照hortonworks手册中的步骤操作;
2、在Ambari web UI上,把HDFS 的configuration还原到开启NameNode HA之前的版本;
3、HDFS成功启动。