背景:
开发一个根据标签的的范围圈定符合条件的所有用户的服务,并将其提供给营销部门使用。在随后的开发过程中 我门发现已经有人做过这块,其文章中描述的服务与我们的需求及其相似。不过我们想要实现的是更为复杂的多条件查询。
摘抄:(以下为前辈的blog主要内容摘要,传送门)
本文主要内容是通过合理hbase 行键(rowkey)设计实现快速的多条件查询,所采用的方法将所有要用于查询中的列经过一些处理后存储在rowkey中,查询时通过rowkey进行查询,提高rowkey的利用率,加快查询速度。行键(rowkey)并不是简单的把所有要查询的列的值直接拼接起来,而是将各个列的数据转成整型(int)数据来存储。之后实现两个自定义的比较器(comparator):一个是相等比较器,用于实现类似于SQL的多条件精确查找功能。
select * from table where col1='a' and col2='b'
另一个是范围比较器,用于实现类似于SQL语句
select * from table where col3 > '10' and col4<'100'
这样的范围查找功能。
当两个比较器配合使用再结合hbase的过滤器,以实现类似于下面这条SQL语句这样多条件的查询
select * from table where col1='a' and col2='b' and col3 > '10' and col4<