转自:
HBase二级索引方案 - Sugan's blogsugan.funHBase简介
HBase是一个构建在HDFS之上,用于海量数据存储分布式列存储系统。
参见下图,由于在HBase中:
- 表的每行都是按照RowKey的字典序排序存储
- 表的数据是按照RowKey区间进行分割存储成多个region
所以HBase主要适用下面这两种常见场景:
- 适用于基于rowkey的单行数据快速随机读写
- 适合基于rowkey前缀的范围扫描
为什么需要HBase二级索引
HBase里面只有rowkey作为一级索引, 如果要对库里的非rowke