1.datanode无法启动:
DataNode(dfs/data/current/VERSION)的clusterID与NameNode(dfs/name/current/VERSION)的不一致,datanode无法启动
解决方法:将NameNode的clusterID复制到DataNode,顺便检查下各个storageID、datanodeUuid是不是不一样的(如果一样需要修改),重启集群
2.datanode启动了,但是不能在dfs中显示:
ssh没有配置好。
解决方法:需重新配置ssh,重启集群
3.在web中看到只有一个
几个datanode的storageID、datanodeUuid一样,namenode把他们都当成一个datanode了
解决方法:修改storageID、datanodeUuid重启集群
有关NameNode、DataNode之类的ID异常的问题,可以优雅的解决(会造成数据丢失):
将搜优node的Tmp目录下的所有文件删除。重新格式化namenode
hdfs namenode -format