Delete类的接口有两个方法:deleteColumns和deleteColumn,它们的区别从method注释里可以看到:
实现上,前者只是传给server一个时间标签,表示这行数据的最后删除版本,因此仅相当于一个普通的put
但是后者必须定位到这行version,因此需要先get到这行数据,再做处理
实际使用中有个陷阱,细心的人会发现如果对某行数据的一个version进行了删除,在compact之前即使再将同一个version的数据写进去,也是读不到的。原因是hbase定位数据是依靠rowkey/timestamp/family/qulifier。假如这四者都一样,那么多次put/delete是无法知道先后顺序的。因此取哪个值取决于KeyValue.Type的值,Delete是在Put之前。所以扫描到Delete就不会再去读Put了。
要想恢复对这个timestamp标签的读写,必须做一次compact,最好是major_compact,确保这一行数据己经从物理上删除了,此时就可以再读取值了。
deleteColumns:Delete all versions of the specified column with a timestamp less than or equal to the specified timestamp.
deleteColumn:Delete the latest version of the specified column.
实现上,前者只是传给server一个时间标签,表示这行数据的最后删除版本,因此仅相当于一个普通的put
但是后者必须定位到这行version,因此需要先get到这行数据,再做处理
实际使用中有个陷阱,细心的人会发现如果对某行数据的一个version进行了删除,在compact之前即使再将同一个version的数据写进去,也是读不到的。原因是hbase定位数据是依靠rowkey/timestamp/family/qulifier。假如这四者都一样,那么多次put/delete是无法知道先后顺序的。因此取哪个值取决于KeyValue.Type的值,Delete是在Put之前。所以扫描到Delete就不会再去读Put了。
要想恢复对这个timestamp标签的读写,必须做一次compact,最好是major_compact,确保这一行数据己经从物理上删除了,此时就可以再读取值了。