1.概述
-
Compaction核心功能是合并小文件,HBase的Compaction分为Minor Compaction和major Compaction两类
-
Minor Compaction选取部分小的,相邻的HFile文件进行合并
-
Major Compaction是将一个Store中的所有HFile文件合并成一个更大的HFile
-
2.合并流程
- HBase启动一个独立线程从对应的Store中选取要合并的HFile
- 从这些HFile中依次读出KeyValue,进行归并排序处理写到./tmp目录下的临时文件
- 将临时文件移动到Store的数据目录
- 将Compation的输入文件路径和输出文件封装成KeyValue写入HLog,并标记为Compation,强行执行sync
- 合并成新的HFile取代之前的HFile对外提供服务
- 删除已经被合并的HFile文件
3.触发时机
- MemStore Flush:每次MemStore Flush都会检查当前Store的文件数量,如果达到阈值则触发Compaction,此时整个Region的所有Store都会执行Compact检查
- 后台周期性检查:后台线程CompactionChecker定期触发检查对应的Store是否需要执行Compation,先检查Store的文件数量然后检查是否满足Major Compation条件(默认7天执行一次)
- 手动触发
4.合并策略
- 合并前检查
- 排除正则执行Compation的文件以及比这些文件更新的所