hbase组合rowkey_HBase二级索引的几种方案

最新推荐文章于 2024-06-05 01:38:23 发布

反斗大飞机

最新推荐文章于 2024-06-05 01:38:23 发布

阅读量576

点赞数

文章标签： hbase组合rowkey

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_30871695/article/details/112356541

版权

01 HBase简介

HBase是一个构建在HDFS之上，用于海量数据存储分布式列存储系统。

参见下图，由于在HBase中：

表的每行都是按照RowKey的字典序排序存储

表的数据是按照RowKey区间进行分割存储成多个region

所以HBase主要适用下面这两种常见场景：

适用于基于rowkey的单行数据快速随机读写

适合基于rowkey前缀的范围扫描

02 为什么需要HBse二级索引

HBase里面只有rowkey作为一级索引， 如果要对库里的非rowkey字段进行数据检索和查询，往往要通过MapReduce/Spark等分布式计算框架进行，硬件资源消耗和时间延迟都会比较高。

为了HBase的数据查询更高效、适应更多的场景， 诸如使用非rowkey字段检索也能做到秒级响应，或者支持各个字段进行模糊查询和多字段组合查询等，因此需要在HBase上面构建二级索引，以满足现实中更复杂多样的业务需求。

03 HBse二级索引方案

基于Coprocessor方案

1、官方特性

其实从0.94版本开始，HBase官方文档已经提出了hbase上面实现二级索引的一种路径：

基于Coprocessor（0.92版本开始引入，达到支持类似传统RDBMS的触发器的行为）

开发自定义数据处理逻辑，采用数据“双写”（dual-write）策略，在有数

最低0.47元/天解锁文章

反斗大飞机

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hbase组合rowkey_HBase二级索引的几种方案

01 HBase简介HBase是一个构建在HDFS之上，用于海量数据存储分布式列存储系统。参见下图，由于在HBase中：表的每行都是按照RowKey的字典序排序存储表的数据是按照RowKey区间进行分割存储成多个region所以HBase主要适用下面这两种常见场景：适用于基于rowkey的单行数据快速随机读写适合基于rowkey前缀的范围扫描02 为什么需要HBse二级索引HBase里面只有row...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。