有时候会有这样的需求,需要删除指定某些行的数据。但是笔者看《Hbase权威指南》好像没有Delete的filter(过滤器),所以想了一下如果实现删除指定行的方法
- 如果知道要删除某些行的行键,那么很简单,用List<Delete>就可以完成这个功能
- 如果要删除的行在表中是连续的,也就是删除指定范围的行,但是你还不知道这个范围内所有的行键,比如一个表中行键11-19的行,但是表中只有11,13,16。这时可以采用的方法是用Scan先读出范围内的行键,用Scan方法就可以使用Filter,其中有一个Filter是KeyOnlyFilter,因为我们只需要Key
- Scan sc = new Scan();
- Filter fil = new KeyOnlyFilter();
- sc.setStartRow(startRow);
- sc.setStopRow(stopRow);
- 上面提到了Filter,所以我们可以通过用Scan和Filter来读取指定Key然后再Delete
- Scan scan=new Scan();
- Filter filter=new RowFilter(CompareFilter.CompareOp.EQUAL,
- new RegexStringComparator(pyramidName));
- scan.setFilter(filter);
- ResultScanner resultScanner=tileTable.getScanner(scan);
- List<Delete> deletes=new ArrayList<Delete>();
- for(Result result:resultScanner){
- byte[] row=result.getRow();
- Delete deleteTile=new Delete(row);
- deletes.add(deleteTile);
- }
- tileTable.delete(deletes);
PS:第三种方法会在集群中传送很多无用的数据,无形中增加了网络的带宽。但是这也是没有办法的事情。以上代码都没经过测试,大体是这个意思
PSS:如果谁有更好的方法,希望能和他说一声
转自:转载