【问题解决】Hadoop集群启动后执行JPS没有DataNode或NameNode

wydxry

已于 2025-02-05 15:35:45 修改

阅读量4w

点赞数 76

分类专栏：大数据 Hadoop 遇到的Bug 文章标签： hadoop hdfs 大数据

于 2021-04-18 10:51:58 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wydxry/article/details/115820101

版权

遇到的Bug 同时被 3 个专栏收录

7 篇文章

订阅专栏

1 篇文章

订阅专栏

1 篇文章

订阅专栏

本文分享了在搭建Hadoop集群过程中遇到的问题及其解决方法，包括格式化NameNode、启动HDFS和YARN等关键步骤，并提供了详细的命令及注意事项。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

引言

最近在尝试在搭建Hadoop集群并测试集群是否搭建成功，但是第一次格式化NameNode并启动HDFS和YARN时发现一会儿有DataNode或者NameNode但是后面就没有了，二者没有同时存在，也尝试过停止进程再重新启动都没有解决掉该问题。

相关命令

集群第一次启动，格式化NameNode

bin/hdfs namenode -format

启动HDFS

sbin/start-dfs.sh

停止HDFS

sbin/stop-dfs.sh

启动YARN

sbin/start-yarn.sh

停止YARN

sbin/stop-yarn.sh

启动历史服务器

sbin/mr-jobhistory-daemon.sh start historyserver

停止所有进程

sbin/stop-all.sh

删除文件

rm 文件名

删除文件夹及文件

rm -rf 文件夹名

问题原因

可能是配置文件出错，需要检查core-site.xml 和 hdfs-site.xml这俩文件；
可能是多次格式化NameNode，但是格式之前并没有停止之前的进程并删除相关数据。

解决方式

（1）需要检查core-site.xml 和 hdfs-site.xml；
（2）重新格式化：先停止上次启动的所有namenode和datanode进程，然后再删除data和log数据。（具体删除方式见下面截图，亲测有效！）

删除dfs文件夹里的文件
路径：/opt/module/hadoop-2.7.2/data/tmp/dfs
删除nm-local-dir文件夹
路径：/opt/module/hadoop-2.7.2/data/tmp
删除logs文件夹里的所有文件和文件夹
路径：/opt/module/hadoop-2.7.2/logs
需要在每一个集群结点上执行上述删除操作，
删除操作后，就可以重新执行格式化NameNode操作。

测试结果

节点1（NameNode）：
在这里插入图片描述
节点2：

节点3：

注意

如果集群是第一次启动，需要格式化NameNode，执行一次format就行了（注意格式化之前或者重新格式化，一定要先停止上次启动的所有namenode和datanode进程，然后再删除data和log数据），start-dfs.sh开启namenode和datanode守护进程，停止进程并退出使用stop-dfs.sh。

评论 10

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

wydxry 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。