问题描述
前几天新增了两个节点,一直都没问题,今天突然出了问题。
刚开始是两个新增的节点上没有datanode进程,nodemanager还有。
重启集群后,成了所有的节点(包括master)都没有datanode。
之后把hadoop下的hdfs文件夹删除重建,所有的节点上都有了datanode,但是master没了namenode。
先后尝试的方法有:
1.单纯格式化namenode。对我的情况无效
2.统一格式化之后产生的VERSION文件的内容。
对我没遇到的情况没用,因为我的namespaceID和clusterID在各节点上都是一致的。
或许会对其他人有帮助,见方法出处。
3.最终有效的方法
因为搭建hadoop集群的时候,hadoop目录下自己建了两个文件夹,分别是tmp和hdfs,在hdfs下又新建了name和data两个文件夹。
所以此方法是,将这tmp和hdfs文件夹删除,再重新创建。(每个节点我都做了一遍,当然我只有四个)
然后再对namenode进行格式化。