namenode和datanode启动问题
当namenode启动datanode宕掉,或者datanode启动namenode宕掉时,考虑clusterID出现了不一致情况
使用hdfs namenode开启namenode节点,查看错误日志,对于所有的节点启动异常就去找日志。HDFS中的守护进程启动异常就使用hdfs command来查看日志,或者到对应的节点的/home/hadoop/soft/hadoop/logs日志目录下查看对应的进程日志。
-
namenode节点
- name的VERSION
-
datanode节点
- data的VERSION
- data块池的VERSION
-
datanode节点
- data的VERSION
- datanode节点的块池的VERSION
-
namenode和datanode的组合节点
- name下的VERSION
- data下的VERSION
- data下块池的VERSION
- 如果出现namenode和datanode的clusterID异常,则将所有节点的VERSION中4个属性配置为一致,则可以恢复集群的运行:
- namespaceID
- clusterID
- blockpoolID
- layoutVersion
spaceID - clusterID
- blockpoolID
- layoutVersion
- 上述中layoutVersion并不一致,可能是之前我的集群出现了问题导致的,但layoutVersion并不影响namenode及datanode的匹配