为什么不能一直格式化NameNode
NameNode与DataNode之间需要又相同的集群ID,两者之间需要相互通信,交互数据,交换命令。当频繁的格式化NameNode时,会导致NameNode和DataNode的ID不相同,两者不能进行通信,此时会产生幽灵情况(NameNode和DataNode不能同时启动)
格式化NameNode需要注意
在格式化NameNode之前需要检查NameNode, DataNode进程是否停止,可以使用jps命令,如果未停止需要将两个进程先停掉。之后删除DataNode里面的信息(在core-site.xml文件中hadoop.tmp.dir属性下设置的存储路径)和logs文件夹,最后格式化NameNode