查阅资料发现,原因是多次format Namenode导致的Namenode和DataNode的ID不一致导致的,具体原因如下:
该问题因为多次对namenode进行format,每一次format主节点NameNode产生新的clusterID、namespaceID,于是导致主节点的clusterID、namespaceID与各个子节点DataNode不一致。当format过后再启动hadoop,hadoop尝试创建新的current目录,但是由于已存在current目录,导致创建失败,最终引起DataNode节点的DataNode进程启动失败,从而引起hadoop集群完全启动失败。因此可以通过直接删除数据节点DataNode的current文件夹,进行解决该问题。
解决办法:
删除tmp/dfs/data下的current文件夹,然后重新启动hadoop即可