HDFS中的checkpoint（检查点）的问题

最新推荐文章于 2024-07-03 14:44:32 发布

hadoop2015

最新推荐文章于 2024-07-03 14:44:32 发布

阅读量6.7k

点赞数 2

分类专栏： Hadoop

本文链接：https://blog.csdn.net/liujiyu1989/article/details/47829083

版权

在重新部署Cloudera CDH集群后，HDFS出现checkpoint问题，导致NAME_NODE_HA_CHECKPOINT_AGE健康测试失败。错误显示检查点年龄超过4小时，且secondarynamenode在执行checkpoint时遇到'Inconsistent checkpoint field'异常。问题根源是版本不匹配，因保留了旧版本数据。解决方案是删除旧的checkpoint目录，然后重启集群。

摘要由CSDN通过智能技术生成

1、问题的描述

由于某种原因，需要在原来已经部署了Cloudera CDH集群上重新部署，重新部署之后，启动集群，由于Cloudera Manager 会默认设置dfs.namenode.checkpoint.period和dfs.namenode.checkpoint.txns分别是1个小时和1000000。只要达到这两个条件之一，secondarynamenode会执行checkpoint操作，此时会出现如下的问题：

ERROR：The health test result for NAME_NODE_HA_CHECKPOINT_AGE has become bad: The filesystem checkpoint is 4 hour(s) old. This is 401.25% of the configured checkpoint period of 1 hour(s). Critical 　　　　threshold: 400.00%. 2,793 transactions have occurred since the last filesystem checkpoint. This is 0.28% of the configured checkpoint transaction target of 1,000,000.

经过初步分析，是由于secondarynamenode没有执行checkpoint的原因所导致，于是就查看了一下secondarynamenode的日志，发现真正的错误是：