转自:
HBase二级索引方案 - Sugan's blogsugan.fun![3a4b394c67ff9ed2132f4777665b894b.png](https://i-blog.csdnimg.cn/blog_migrate/eda91acb3856f02c0925f5bd910e82d9.jpeg)
HBase简介
HBase是一个构建在HDFS之上,用于海量数据存储分布式列存储系统。
参见下图,由于在HBase中:
- 表的每行都是按照RowKey的字典序排序存储
- 表的数据是按照RowKey区间进行分割存储成多个region
所以HBase主要适用下面这两种常见场景:
- 适用于基于rowkey的单行数据快速随机读写
- 适合基于rowkey前缀的范围扫描
![89015fb13e6be402a6ff676ef1cbd225.png](https://i-blog.csdnimg.cn/blog_migrate/4d189d41168bcce8b2597ac0617296e2.jpeg)
![8fa9f7879ce0868dca01f30018730632.png](https://i-blog.csdnimg.cn/blog_migrate/a071ca2b6d5238b7b7ddceac04a142a5.jpeg)
为什么需要HBase二级索引
HBase里面只有rowkey作为一级索引, 如果要对库里的非rowke