增删改查的真正面目
Hbase是如何实现增删改查的???
真实的情况是这样的:HBase几乎总是在做新增操作。
当新增一个cell的时候,HBase在HDFS上新增一条数据,类型是PUT。
当修改一个cell的时候,HBase在HDFS又新增一条数据,只是版本号比之前那个大(或者自己定义)。
当删除一个cell的时候,HBase还是新增一条数据!只是这条数据没有value,类型为DELETE,这条数据叫墓碑标记(Tombstone)。
真正的删除发生在什么时候
由于Hbase表在使用过程中积累了很多增删查改操作,数据的连续性和顺序性必然会被破坏。为了提升性能,HBase每间隔一段时间都会进行一次合并(Compaction),合并的对象为HFile文件。合并分为两种minor compaction和major compaction。
在HBase进行major compaction的时候,它会把多个HFile合并成1个HFile,在这个过程中,一旦检测到有被打上墓碑标记的记录,在合并的过程中就忽略这条记录。这样在新产生的HFile中,就没有这条记录了,自然也就相当于被真正地删除了。