异常
1、org.apache.hadoop.hdfs.qjournal.client.QuorumException: Got too many exceptions to achieve quorum size 2/3. 3 exceptions thrown:192.168.7.13:8485: Incompatible namespaceID for journal Storage Directory /home/rimi/bigData/hadoop-2.2.0/tmp/journal/cluster1: NameNode has nsId 2006559846 but storage has nsId 1781480752
分析:原因是journal node中的存储数据版本号与name node中的版本号不一致造成的 ,类似的版本冲突解决的三种方式, Incompatible namespaceID
造成的原因很多是在CDH中,没有关闭HA的情况升级CDH版本,造成journal node的数据与name node数据不一致。也有可能是没有正常关闭集群,造成journal node与name node数据不一致,版本不同。
解决步骤:
- 将name node的版本号改成与journal node的版本号一致 , vi /home/rimi/bigData/hadoop-2.2.0/tmp/dfs/name/current/VERSION
- 启动zookeeper
- 重启集群,dfs-start.sh
- 启动zkfc
- name node的一个节点会正常工作,切换成active
可能出现:另外一个节点不能正常工作,可以重新格式化,并与主节点同步 , 在standby节点执行命令:hdfs namenode -bootstrapStandby可能出现:standby节点不能正常同步的问题: 格式化journal node , 当前的方式就是用 群中正常的journal node数据替换异常的journal no de , 格式化journaln ode