Hadoop集群启动后缺少进程问题

小刘同学

已于 2024-04-16 11:15:12 修改

阅读量658

点赞数 6

分类专栏： Hadoop 文章标签： hadoop linux 大数据

于 2024-04-15 16:40:39 首次发布

本文链接：https://blog.csdn.net/m0_68533987/article/details/137742977

版权

Hadoop 专栏收录该内容

3 篇文章

订阅专栏

本文介绍了Hadoop集群中DataNode和NameNode在重启后可能遇到的clusterID不一致问题，以及SSH免密登录未配置和配置文件错误导致的进程问题。解决方法包括停止进程、清理DataNode信息、格式化并重新启动集群，以及确保配置文件正确无误。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、DataNode和NameNode进程同时只能有一个工作的问题

NameNode在format初始化后会生成cluster ID（集群id）

DataNode在启动后也会生成和NameNode一样的clusterID

当NameNode突然被杀死或集群突然宕机，再次格式化后NameNode会生成新的clusterID，与未删除的DataNode的clusterID不一致就会导致该问题的发生。

解决方法：

① 先停止所有进程

② 删除DataNode里的信息（默认在/tmp，如果修改了就在自己配置的目录下）

hadoop102/103/104都要删除。即所有虚拟机上都要删除

③ 格式化后启动集群

二、SSH免密登录没有配置完全

如果免密登录没有配置好也会出现进程缺少的问题，检查是否所有节点都配置了SSH免密登录，包括自身节点。

三、配置文件错误

大家在修改好配置文件后，最好再检查一遍内容是否正确。

如果进程没有正常启动，查看发现是配置文件出错，先把集群所有进程关闭，修改好配置文件后重新格式化。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

小刘同学

关注关注

6
点赞
踩
4

收藏

觉得还不错? 一键收藏
2
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

hadoop集群的其他集群没有namenode和datanode进程？

weixin_46573136的博客

12-06

1435

启动hadoop121，发现另外两个集群都没有DataNode进程查看VERSION

Hadoop集群开启后使用jps命令查看发现没有NameNode、SecondaryNameNode、DataNode、NodeManager进程，缺少进程。

m0_74132943的博客

09-12

3054

今天安装Hadoop集群，安装完成使用jps命令查看发现没有NameNode、SecondaryNameNode、DataNode、NodeManager进程，别人jps后都有6个在跑，我就两个。重启服务...........................................................

2 条评论您还未登录，请先登录后发表或查看评论

虚拟机中Hadoop集群NameNode进程缺失问题解析与解决

2202_75961842的博客

05-13

2891

在操作Hadoop集群时，务必遵循正确的启动和停止流程，避免异常退出导致的问题。定期检查Hadoop集群的配置文件，确保各项配置正确无误。在进行NameNode格式化之前，务必备份重要数据，以防数据丢失。如果在解决问题过程中遇到其他错误或异常，请查看Hadoop的日志文件以获取更多详细信息，并根据日志提示进行相应的调整。

hadoop集群启动遇到的问题之hadoop1启动,集群别的机器hadoop2,hadoop3没有启动

leaxning的博客

06-25

2910

hadoop群起的问题hadoop1正常启动,但是hadoop2,3都是不正常分析问题解决方法 hadoop1正常启动,但是hadoop2,3都是不正常 – 自己搭的hadoop群起服务,第一台机器是正常启动, 但是第二台就没有datanodes,第三台也么有分析问题 – 分析了一下,感觉就是要不ssh免密没做好, – 要不就是群起配置有问题, – 最后就是初始化出现问题; 解决方法 1,先是进去.ssh文件看了下,没有问题,并且手动测试了ssh相互登录,可以; 2,再去看看了关键的群起配置, 这五大

Hadoop start-dfs.sh启动后jps没显示进程，已解决！！！

最新发布

02-25

### Hadoop集群启动缺少DataNode解决方案 #### 清除数据节点存储目录对于Hadoop集群启动时DataNode进程缺失的问题，可以尝试删除各虚拟机上Hadoop安装路径下的特定文件夹来解决问题。具体来说，应当移除`/export/...

当hadoop集群安装完毕后，发现没有DataNode进程

m0_65346688的博客

09-20

3057

那么，为什么会出现这个问题呐？在这个目录下输入ls，然后进入到data，再输入ls，进入到data，输入ls，进入到dfs中（有的进入data中后，是tmp，那就输入ls，进入到dfs中），输入ls，进入到data，输入ls，进入到current中，输入ls，发现了VISION,然后就可以vi VERSION了。查看这两个的clusterID是否一致，如果不一致，那我们就讲他们改为一样的就好了，修改后，保存退出（因为我的已经改好过了，所以一致），再重新启动一下集群，输入jps，发现就有DataNode。

linux查看端口占用情况

qq_35592856的博客

01-31

949

ps -ajx 查看多有的进程 netstat -anptu | grep node 查看node进程 lsof -i:8000 查看指定端口的占用情况 netstat -anp|grep 4566 查看指定端口的PID号 netstat -ano 查看所有的端口情况 ...

Hadoop集群缺少进程初步解决方案

Quin22的博客

12-23

4680

没有类似截图，口头说的详细点按我这方法应该能解决大部分问题，如果还不得我也无能为力这个方法就是把hadoop重置到格式化之前因为你没格式化之前，上面三项都是不存在的，你格式化后才会出现通常守护进程缺失或者自己死亡就是因为你格式化次数太多，导致出错，用这个方法可以把hadoop重置到格式化之前 hadoop配置文件中 core-site.xml有一项配置是这么写的这里配置是为了指定hadoop的临时文件夹 <property> <name&

hadoop集群关闭命令顺序_hadoop2.x启动停止的命令

weixin_42509815的博客

02-01

888

一、启动，按启动顺序执行命令。如果需要关闭集群，则按反顺序执行即可。1.如果使用hdfs HA，需先启动zookeeper集群，具体请查看zookeeper的相关命令。2.如果使用hdfs HA，需格式化zookeeper集群，整个hdfs集群只需第一次启动时执行一次，整个hdfs集群只需第一次启动时执行一次，整个hdfs集群只需第一次启动时执行一次，命令如下：bin/hdfs zkfc -for...

为什么hadoop启动之后的进程数量不够

qq_64886378的博客

09-23

1071

三台虚拟机进程够的话就是成功了，如果进程不够但代码也没错也先不必着急，先使用IP地址在网页上查看是否能查看虚拟机配置，如果可以的话可能就是你的jdk的版本过高，他jdk版本过高的话可能就会有进程不会显示出来，如果你想看着舒服将他显示出来，就需要你把你的jdk重新删掉再安装低版本的jdk，jdk的环境配置也要重新改正一下。要是我们使用jps查看进程，但是进程的数量不够，那可能就是我们的配置文件少了一些东西，也有可能是我们jdk版本过高，虽然他不会显示出来，但最终的网页还是能查看虚拟机的配置。

Yarn重启applications记录恢复

fanxl10的专栏

06-24

1295

Yarn重启applications记录恢复配置配置参数，该参数用来指定RM在重启之前将自己的状态保存在何种存储媒介上，目前有3种存储可选org.apache.hadoop.yarn.server.resourcemanager.recovery.FileSystemRMStateStore 默认值，是基于文件系统的存储（本地存储或者HDFS）。可以指定yarn.resourcemanager.fs.state-store.uri作为存储路径...

Hadoop集群启动后，缺少namenode或datanode进程

y215204的博客

10-01

1万+

简述：NameNode 是 HDFS 的主节点，是负责管理整个 HDFS 集群的，相当于一个团队的老大,若没有启动，则不会进入web界面等。

hadoop集群启动唯独缺少DataNode进程的解决方法

m0_74119720的博客

08-02

5007

Hadoop缺少datanode进程

HDFS主节点DataNode正常启动但是从节点jps没有DataNode进程[已解决]

haj6468的博客

04-17

3655

1.首先可能是权限问题，之前有不小心用root用户启动过Hadoop，所以得排查Hadoop，安装路径的权限是不是hadoop用户的。包括/data/dn /data/nm。③data/nn/current ，/data/dn/current下的VERSION文件的clusterID不一致！查看/etc/host 文件里面是否设置好了代理，和第一点的wokers文件是否一致，每个节点都得看看。2.权限问题排查之后，查看日志，一般在hadoop/logs文件夹下，每个节点都看一下。

namenode掉了？亲测有用！！

qq_61847352的博客

01-14

528

解决namenode掉进程问题解答！