这几天重读《HBase权威指南》,看到HBase的数据模型及数据操作机制中的数据删除。当接收到数据删除指令后,系统并没有立即删除HFile中存储的数据,而是设置一个标志位标志其被删除(在HDFS中数据删除时被移到/trash文件夹缓冲区),此时系统会根据标志位响应客户端的访问请求,待系统的下一次大合并(major campaction)将被标志的数据块删除,这才算彻底的完成数据的删除。
由标志删除到大合并彻底删除这个过程我联想到了JVM中垃圾回收过程二者有相似之处。在《深入理解JVM》中有介绍:
对象死亡的标记过程:
在可达性分析算法中不可达的对象,并非是“非死不可”的,这时候它们暂时处于“缓刑”阶段,要真 正宣告一个对象死亡,至少要经历两次标记过程:
1)如果对象在进行可达性分析后发现没有与GC Roots相连接的引用链,那它将会被第一次标记并且进行一次筛选,筛选的条件是此对象是否有必要执行finalize()方法。当对象没有覆盖finalize()方法,或者finalize()方法已经被虚拟机调用过,虚拟机将这两种情况都视为“没有必要执