有时候会有这样的需求,需要删除指定某些行的数据。但是笔者看《HBase权威指南》好像没有Delete的filter(过滤器),所以想了一下如果实现删除指定行的方法
- 如果知道要删除某些行的行键,那么很简单,用List<Delete>就可以完成这个功能
- 如果要删除的行在表中是连续的,也就是删除指定范围的行,但是你还不知道这个范围内所有的行键,比如一个表中行键11-19的行,但是表中只有11,13,16。这时可以采用的方法是用Scan先读出范围内的行键,用Scan方法就可以使用Filter,其中有一个Filter是KeyOnlyFilter,因为我们只需要Key
Scan sc = new Scan(); Filter fil = new KeyOnlyFilter(); sc.setStartRow(startRow); sc.setStopRow(stopRow);
- 上面提到了Filter,所以我们可以通过用Scan和Filter来读取指定Key然后再Delete
Scan scan=new Scan(); Filter filter=new RowFilter(CompareFilter.CompareOp.EQUAL, new RegexStringComparator(pyramidName)); scan.setFilter(filter); ResultScanner resultScanner=tileTable.getScanner(scan); List<Delete> deletes=new ArrayList<Delete>(); for(Result result:resultScanner){ byte[] row=result.getRow(); Delete deleteTile=new Delete(row); deletes.add(deleteTile); } tileTable.delete(deletes);
PS:第三种方法会在集群中传送很多无用的数据,无形中增加了网络的带宽。但是这也是没有办法的事情。以上代码都没经过测试,大体是这个意思
PSS:如果谁有更好的方法,希望能和我说一声