hadoop伪分布式下无法启动datanode的原因及解决办法

最新推荐文章于 2025-04-17 16:41:58 发布

love666666shen

最新推荐文章于 2025-04-17 16:41:58 发布

阅读量2.9w

点赞数 14

分类专栏：大数据文章标签： hadoop 格式化 datanode无法启动

本文链接：https://blog.csdn.net/love666666shen/article/details/74350358

版权

大数据专栏收录该内容

15 篇文章

订阅专栏

本文介绍了在Hadoop2.6伪分布式环境中，频繁格式化文件系统导致datanode无法启动的问题。分析了问题产生的原因在于namenode与datanode的namespaceID不一致，并提供了详细的解决步骤。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1. 环境描述：

虚拟机12.0，Ubuntu 14.04，伪分布式安装Hadoop2.6。

2. 问题描述：

多次格式化文件系统时，会出现datanode无法启动。如下图：

3. 问题产生原因：

执行文件系统格式化时（即执行命令 $ bin/hadoop namenode -format 后），会在namenode数据文件夹（即配置文件中dfs.name.dir在本地系统的路径）中保存一个current/VERSION（我的路径为 usr/local/hadoop/tmp/dfs/name/ current/VERSION，其中hadoop为建立虚拟机时为虚拟机系统所取的用户名）文件，记录namespaceID，标识了所格式化的namenode的版本。如果我们频繁的格式化namenode，那么datanode中保存（即配置文件中dfs.data.dir在本地系统的路径）的current/VERSION文件（路径为 usr/local/hadoop/tmp/dfs/data/ current/VERSION）只是你第一次格式化时保存的namenode的ID，因此就会造成namdenode 的 namespaceID 与 datanode的namespaceID 不一致，从而导致namenode和 datanode的断连。

4. datanode启动日志：

查看日志(在 /usr/local/hadoop/logs/hadoop-hadoop-datanode-hadoop-virtual-machine.log下)发现：

************************************************************/

2017-07-3 17:40:59,973 ERROR org.apache.hadoop.hdfs.server.datanode.DataNode: java.io.IOException: Incompatible namespaceIDs in /home/xsj/hadoop/hadoop-0.20.2/hdfs/data: namenode namespaceID = 1825353369; datanode namespaceID = 1986950792

5. 解决方案：

把/tmp下的Hadoop开关的临时文件删除
把/hadoop.tmp.dir目录清空
注：在每次执行hadoop namenode -format时，都会为NameNode生成namespaceID,，但是在hadoop.tmp.dir目录下的DataNode还是保留上次的namespaceID，因为namespaceID的不一致，而导致DataNode无法启动，所以只要在每次执行hadoop namenode -format之前，先删除hadoop.tmp.dir（路径为 /usr/local/hadoop/下的）tmp目录就可以启动成功，或者删除/usr/local/hadoop/tmp/dfs下的data目录，然后重新启动dfs（在hadoop安装路径 /usr/local/hadoop/ 下，运行命令./sbin/start-dfs.sh）即可。请注意是删除hadoop.tmp.dir对应的本地目录，即/usr/local/hadoop/下的tmp文件夹，而不是HDFS目录。

也可以试着参考http://blog.sina.com.cn/s/blog_76fbd24d01017qmc.html 或者http://blog.csdn.net/hackerwin7/article/details/19973045这两篇文章。

6. 重启后执行jps命令：