记一次hbase的TTL功能不生效问题

最新推荐文章于 2025-04-16 17:03:21 发布

༺❀ൢ 故渊 ❀ൢ༻

最新推荐文章于 2025-04-16 17:03:21 发布

阅读量1.3k

点赞数

CC 4.0 BY-SA版权

分类专栏： hadoop 文章标签：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/trmplarguard/article/details/107040308

本文记录了一次解决HBase TTL不生效导致HDFS空间问题的经历。问题表现为即使设置了TTL，HDFS空间仍持续增长。通过研究发现，HBase的TTL依赖major compaction清除数据，而数据实际被移动到datanode的trash目录。这与HDFS的垃圾回收机制相关，并可能与正在进行的Rolling upgrade有关。解决方案涉及理解HBase和HDFS的工作原理，调整major compaction频率以及调查Rolling upgrade的影响。

最近接手了一个的hbase和hadoop的小集群，被告知hbase有TTL不生效的问题（磁盘未释放），做个记录

hbase版本1.2.7

hdfs版本2.7.5

问题描述：

hbase中所有的表都配置了TTL，然而hdfs使用量依然不断增加，直至磁盘打满，datanode全挂。

解决过程：

1、在我负责接手这部分服务后，了解到之前伙伴的处理方式简直简单粗暴，每次出现问题，直接rm -rf datanode数据目录下的 BP-XXXXX目录。。。终于知道hdfs为什么会有9000+个corrupt block了。

2、二话不说，先fsck，清理掉这些坏块。另外看到namenode ui还有这么个东西

1月3日开始的一个Rolling upgrade。。。现在已经是6月份了，本着既然正常用着就不随便变更的原则，对于Rolling upgrade咱们经验也不丰富，暂时先不管。

3、从hbase原理上来看看待TTL这个问题，hbase的TTL本质是先对数据打一个墓碑标记，真正删除的时候是在major compaction的时候生效（有那么点类似于JVM复制算法）；另外一个是MIN_VERSION要为0，否则无论如何TTL都不会生效。

了解当前hbase的情况，使用默认配置7天一次major compaction，但是当前场景是数据4天会写满集群，数据保存1天就够用，那么正常来说集群空间使用应该不超过50%。所以major compaction的频率也应该是1天一次比较合适。

4、按照正规流程。做好变更的准备工作（具体怎么变更，怎么回退），周知业务，变更hbase。

5、发现问题依然存在，具体表现为，从hdfs的层面看使用的空间很小，当前约为10%，但是具体每个datanode的空间使用率居然为50%，经过仔细核对，发现data

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。