Hadoop中DataNode没有启动解决办法

查看从节点机器hadoop中datanode的log文件 , 拉到最后 , 报错如下

2017-11-22 13:51:17,114 WARN org.apache.hadoop.hdfs.server.common.Storage: java.io.IOException: Incompatible clusterIDs in /home/grid/hadoop-2.7.2/dfs/data: namenode clusterID = CID-edebd8f9-ab63-4a20-a78b-f48facee4fc8; datanode clusterID = CID-f74e6565-1141-42a7-bb05-ee30224d187e
2017-11-22 13:51:17,117 FATAL org.apache.hadoop.hdfs.server.datanode.DataNode: Initialization failed for Block pool <registering> (Datanode Uuid unassigned) service to /10.6.5.7:10000. Exiting. 
java.io.IOException: All specified directories are failed to load.
    at org.apache.hadoop.hdfs.server.datanode.DataStorage.recoverTransitionRead(DataStorage.java:478)
    at org.apache.hadoop.hdfs.server.datanode.DataNode.initStorage(DataNode.java:1358)
    at org.apache.hadoop.hdfs.server.datanode.DataNode.initBlockPool(DataNode.java:1323)
    at org.apache.hadoop.hdfs.server.datanode.BPOfferService.verifyAndSetNamespaceInfo(BPOfferService.java:317)
    at org.apache.hadoop.hdfs.server.datanode.BPServiceActor.connectToNNAndHandshake(BPServiceActor.java:223)
    at org.apache.hadoop.hdfs.server.datanode.BPServiceActor.run(BPServiceActor.java:802)
    at java.lang.Thread.run(Thread.java:748)
2017-11-22 13:51:17,137 WARN org.apache.hadoop.hdfs.server.datanode.DataNode: Ending block pool service for: Block pool <registering> (Datanode Uuid unassigned) service to /10.6.5.7:10000
2017-11-22 13:51:17,251 INFO org.apache.hadoop.hdfs.server.datanode.DataNode: Removed Block pool <registering> (Datanode Uuid unassigned)
2017-11-22 13:51:19,252 WARN org.apache.hadoop.hdfs.server.datanode.DataNode: Exiting Datanode
2017-11-22 13:51:19,253 INFO org.apache.hadoop.util.ExitUtil: Exiting with status 0
2017-11-22 13:51:19,288 INFO org.apache.hadoop.hdfs.server.datanode.DataNode: SHUTDOWN_MSG: 
/************************************************************
SHUTDOWN_MSG: Shutting down DataNode at db2/10.6.5.30
************************************************************/

此原因是namenode和datanode的clusterID不一致导致datanode无法启动.
产生的原因是多次hdfs namenode -format , 每一次format,namenode都会生成新的clusterID , 而datanode还是保持原来的clusterID.

解决办法:

  1. cat hadoop-2.7.2/dfs/name/current/VERSION 复制namenode的clusterID.
  2. 用该clusterID把所有datanode节点机器中hadoop-2.7.2/dfs/data/current/VERSION中的clusterID替换掉

完成
重新启动start-all.sh
正常启动

  • 10
    点赞
  • 29
    收藏
    觉得还不错? 一键收藏
  • 9
    评论
### 回答1: 如果HadoopDataNode没有启动,可能是由于以下原因之一: 1. 配置文件错误:检查Hadoop配置文件DataNode相关的配置是否正确,如HDFS配置文件的hdfs-site.xml和core-site.xml文件。 2. 端口占用:确保DataNode所需的端口没有被其他进程占用。DataNode默认使用50010和50020端口。 3. 硬盘空间不足:检查DataNode所在的硬盘空间是否足够。如果硬盘空间不足,DataNode可能无法启动。 4. 资源不足:检查DataNode所在的机器的资源是否足够。如果资源不足,如内存、CPU等,DataNode可能无法启动。 解决方法: 1. 检查配置文件,确保DataNode相关的配置正确无误。 2. 确认DataNode所需的端口没有被占用。 3. 清理硬盘空间,确保DataNode所在的硬盘空间足够。 4. 确保DataNode所在的机器的资源足够,如内存、CPU等。 5. 查看日志文件,排查错误。在Hadoop的logs目录下,可以找到DataNode的日志文件,检查其的错误信息,以便进一步排查问题。 ### 回答2: Hadoop是一个分布式存储和计算框架,由于它的高可靠性和可扩展性,被广泛使用。在Hadoop集群datanode是承担存储数据的角色,如果datanode没有启动,会对整个集群的正常运行产生重大影响。 首先,我们需要找出datanode为什么没有启动的原因。可能有以下几个原因: 1. Hadoop配置错误:在配置文件,可能因为错误的配置把datanode关掉了。我们需要检查配置文件,确认datanode是否已被启用。 2. 硬件故障:硬件设备也可能出现问题,如硬盘、网络连接等。我们需要检查硬盘是否正常、网络是否通畅。 3. 安全设置问题:安全设置可能阻止了datanode启动。这时我们需要检查安全设置是否正确。 4. 资源不足:如果datanode使用到的资源(如内存)被其他程序占用,则无法正常启动。我们需要检查集群的内存使用情况,并对可能占用内存的程序进行调整或关闭。 如果找出了原因,我们可以尝试解决问题。如果是配置错误,我们需要修改配置文件。如果是硬件故障,则需要更换硬件设备。如果是安全设置问题,则需要修改安全设置。如果是资源不足,则需要释放资源或增加资源。 当然,我们还可以通过查看Hadoop日志信息排查问题。可以了解datanode出现问题的具体原因,然后再进行针对性地处理。 总之,datanode无法启动会对整个Hadoop集群产生影响,我们需要及时找到问题所在,并采取相应措施解决问题。 ### 回答3: 在Hadoopdatanode作为数据节点承载存储HDFS文件系统的数据,如果datanode没有启动,那么将无法读取或写入数据,会严重影响HDFS文件系统的正常运行。 要解决这个问题,需要采取一些措施: 1. 检查datanode日志:首先,需要查看datanode的日志文件,以确认具体的错误原因。datanode的日志文件通常在Hadoop安装目录下的logs文件夹,可以通过以下命令来查看: $ tail -f /path/to/hadoop/logs/hadoop-[username]-datanode-[hostname].log 2. 确认datanode是否在运行:如果datanode没有启动,可以通过以下命令来启动它: $ cd /path/to/hadoop/bin $ ./hadoop-daemon.sh start datanode 3. 检查datanode配置文件:如果datanode的配置文件存在错误,也可能导致它无法启动。因此,需要确认datanode的配置文件是否正确。datanode的配置文件通常在Hadoop安装目录下的conf文件夹,可以通过以下命令来检查配置文件的正确性: $ cd /path/to/hadoop/conf $ vi hdfs-site.xml 其,hdfs-site.xml文件是datanode的主要配置文件,可以通过修改该文件来配置datanode的相关参数。 4. 确认datanode是否与namenode通信:如果datanode不能与namenode通信,也可能导致它无法启动。因此,需要确认datanode的网络连接是否正常。可以通过以下命令来测试datanode与namenode之间的网络连接: $ ping [namenode hostname or IP address] 如果命令执行成功,则表示datanode与namenode之间的网络连接正常。 总之,如果datanode不能正常启动,需要仔细检查日志文件、配置文件、网络连接等因素,以找出具体的错误原因,并采取相应的措施来解决问题。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值