1、背景
由于hbase建表时没有设置数据的保存日期,现在表数据量大了,需要清理一些很久之前的数据。这里可以通过设置表的TTL,然后通过系统触发major compact进行数据清理。
2、清理步骤
1、查看ttl是forever的表:desc '表名'
2、备份表:snapshot '表名',‘快照名’
3、停用表:disable '表名'
4、给表添加ttl:alter '表名' , {NAME=>'列簇',TTL=>'604800'}
5、开启表:enable '表名'
3、清理脚本
1、查看ttl是forever的表
#!/bin/bash
# clean logs
rm -rf /root/hbase