报错内容:
文件系统检查点已有 2 天,16 小时,54 分钟。占配置检查点期限 1 小时的 6,490.14%。 临界阈值:400.00%。 自上个文件系统检查点以来已发生 63,898 个事务。这是 1,000,000 的已配置检查点事务目标的 6.39%。
马上查看log文件发现secondarynamenode报错检测不到edits文件
ERROR org.apache.hadoop.hdfs.server.namenode.SecondaryNameNode: Exception in doCheckpoint
java.io.IOException: Found no edit logs to download on NN since txid 10098943
啥情况啊,百度发现一篇类似问题的文章,讲解的非常详细关于监测点内容
https://blog.csdn.net/liujiyu1989/article/details/47829083
但是博主是secondarynamenode没有执行执行检查点的操作,而我这是没有找到edits文件,所有还得继续排查
因为集群部署不是我搭建的,我刚刚临时接手处理
发现集群上面搭建过高可用namenode,上面有journalNode在运行但是没有stand by NameNode
奇怪啊!问了一下前同事说拆除了然后加了一个secondarynamenode,原来如此
那么问题就很清楚了&#x