hadoop2.0报错“There appears to be a gap in the edit log”

最新推荐文章于 2021-07-12 19:45:41 发布

amber_amber

最新推荐文章于 2021-07-12 19:45:41 发布

阅读量7.9k

点赞数 3

分类专栏： Hadoop学习分享文章标签： hadoop2.0 edits namenode

本文链接：https://blog.csdn.net/Amber_amber/article/details/46896719

版权

今天升级集群的时候遇到了这个问题。解决问题的过程中，借机也巩固了下对namenode启动过程的理解。这个问题网上几乎没查到好的解决办法，Google出来的办法说让Recovery，对已经有很大数据量的线上集群来说，风险太大，不可取。所以只能自己读着源码一步一步分析，最终还是完美地解决了，哈哈。

摘要由CSDN通过智能技术生成

今天升级集群的时候遇到了这个问题。解决问题的过程中，借机也巩固了下对namenode启动过程的理解。这个问题网上几乎没查到好的解决办法，Google出来的办法说让Recovery，对已经有很大数据量的线上集群来说，风险太大，不可取。所以只能自己读着源码一步一步分析，终于还是找到了解决方法.

问题描述：

因为要升级集群，所以先停服务-->做升级-->重启服务。但是在重启服务的时候，standby namenode启动失败，每次都是先启动成功，然后在加载元数据的时候失败，shutdown. 报错如下：

<span style="font-family:Microsoft YaHei;font-size:12px;">2015-07-15 16:26:44,305 FATAL org.apache.hadoop.hdfs.server.namenode.NameNode: Exception in namenode join
java.io.IOException: There appears to be a gap in the edit log.  We expected txid 176531929, but got txid 176533587.
        at org.apache.hadoop.hdfs.serv

最低0.47元/天解锁文章

amber_amber

关注

3
点赞
踩
6

收藏

觉得还不错? 一键收藏
4
评论
hadoop2.0报错“There appears to be a gap in the edit log”

今天升级集群的时候遇到了这个问题。解决问题的过程中，借机也巩固了下对namenode启动过程的理解。这个问题网上几乎没查到好的解决办法，Google出来的办法说让Recovery，对已经有很大数据量的线上集群来说，风险太大，不可取。所以只能自己读着源码一步一步分析，最终还是完美地解决了，哈哈。
复制链接

扫一扫