引言
格式化NameNode并启动HDFS和YARN时发现一会儿有DataNode或者NameNode但是后面就没有了,二者没有同时存在,也尝试过停止进程再重新启动都没有解决掉该问题。
问题原因
可能是配置文件出错,需要检查core-site.xml 和 hdfs-site.xml这俩文件;
可能是多次格式化NameNode,但是格式之前并没有停止之前的进程并删除相关数据。
解决方式
(1)需要检查core-site.xml 和 hdfs-site.xml;
(2)重新格式化:先停止上次启动的所有namenode和datanode进程,然后再删除data和log数据。(具体删除方式见下面截图,亲测有效!)
删除dfs文件夹里的文件
删除nm-local-dir文件夹
删除logs文件夹里的所有文件和文件夹
!!!!!!需要在每一个集群结点上执行上述删除操作!!!!!!!
删除操作后,就可以重新执行格式化NameNode
测试结果
重新启动服务
jps检查进程
全部启动成功,再去二三号机检查进程
!!!注意!!!
如果集群是第一次启动,需要格式化NameNode,执行一次format就行了,不要没事就乱格式化,
格式化多了,会导致一些东西不同步,使datanode与namenode启动失败