datanode或者namenode无法启动

问题描述


起初问题是datanode无法启动,查看datanode中/home/zkpk/Software/hadoop-2.4.0/logs的datanode日志发现问题是cluster ID不一致导致的。
这里写图片描述

网上的解决方法有修改datanode的clusterID与namenode的clusterID一致或者直接删除datanode的VERSION两种方法。

由于没搞清楚几个VERSION的区别,随便找到一个删了就觉得可以了,在slave节点的hadoopdata/dfs/name/current下面没有找到VERSION,但是在master节点的hadoopdata/dfs/name/current下面找到了VERSION,于是删除之,重新格式化namenode并重启集群,结果slave节点中的datanode出现了,但是master节点中的namenode没了。

查看master中/home/zkpk/Software/hadoop-2.4.0/logs的namenode日志,
这里写图片描述

然而在启动之前明明格式化了那namenode,所以是怎么回事呢?

现在datanode启动成功说明不存在ID不一致的问题了,那么namenode无法启动会不会是因为删错了东西。
经过调查发现果然如此,应该删除的是datanode的/home/zkpk/hadoopdata/dfs/data/current目录下的VERSION,因为开始在图形界面打开该目录无法显示,所以没有找到该VERSION。应该在root权限下进入该目录删除VERSION。

原因很简单,集群启动namenode需要从master的/home/zkpk/hadoopdata/dfs/name/current中找到VERSION获取集群ID,若删除该文件则找不到clusterID所以无法启动namenode,而且因为没有了namenode的clusterID,因此datanode启动时不存在datanodeID和namenodeID不匹配的问题,因此datanode成功启动。
总结:应该删除的slave节点的/home/zkpk/hadoopdata/dfs/data/current下的VERSION,不能删除master节点的/home/zkpk/hadoopdata/dfs/name/current下的VERSION。

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值