在今年的北京QCon大会上,360公司的系统部技术经理赵健博在演讲中公布了360公司的HBase二级索引方案,这一方案的提出将比华为HBase二级索引更好的解决了Hbase的多维实时查询问题。它的核心思想是保证了索引和数据在同一region上,减少了IO通信,提升了HBase的读性能,并且无非修改HBase源码,实现更加简单。
360HBase二级索引公布的演讲视频:http://www.infoq.com/cn/presentations/qihoo360-hbase-two-stage-index-design-and-practice。
经过自己对其一段时间的学习和研究,列出一些总结如下:
1、设计思想
索引的思想依然是倒排索引的思想,即将需要查询的列作为索引数据的Rokwey,查询列所在记录的Rowkey作为索引数据的va