Hbase的二级索引

最新推荐文章于 2024-06-05 01:38:23 发布

K. Bob

最新推荐文章于 2024-06-05 01:38:23 发布

阅读量690

点赞数

分类专栏： HBase

本文链接：https://blog.csdn.net/ThreeAspects/article/details/106425827

版权

本文探讨了HBase中二级索引的设计和实现，由于HBase不支持跨表事务，开发者需要自行实现分布式事务机制以保证数据一致性。二级索引本质是创建列值与行键的映射，通过特定的Hash前缀策略，确保索引与主数据在同一Region，降低查询性能损失。同时，逻辑和物理上的双重隔离解决了混合存储带来的问题，实现了性能和可维护性的平衡。

摘要由CSDN通过智能技术生成

由于在 HBase 中的二级索引是通过建表的方式实现的，当需要更新时，就是两个表的数据原子更新，也就是跨表的事务功能，而 Hbase 只提供行级事务，没有跨表和跨行的事务功能，这就需要开发者自己去实现，如果对数据一致性要求较高，那么就可能需要自己去实现一套分布式的事务机制，之所以是分布式的事务机制，是因为原始数据可能由一些 HRegionserver 维护，而索引表由另外一些 HRegionserver 维护，这个事务机制就涉及到了多个HRegionserver，也就是分布式的事务机制。

二级索引设计

二级索引的本质就是建立各列值与行键之间的映射关系，以列的值为键，以记录的RowKey 为值。
在这里插入图片描述
如图所示，当要对 F:C1 这列建立索引时，只需要建立 F:C1 各列值到其对应行键的映射关系，如 C11->RK1 等，这样就完成了对 F:C1 列值的二级索引的构建，当要查询符合 F:C1=C11 对应的 F:C2 的列值时。其查询步骤如下:

1. 根据 C1=C11 到索引数据中查找其对应的 RK，查询得到其对应的 RK=RK1;
2. 得到 RK1 后就自然能根据 RK1 来查询 C2 的值了 这是构建二级索引大概思路，其 他组合查

最低0.47元/天解锁文章

K. Bob

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Hbase的二级索引

由于在 HBase 中的二级索引是通过建表的方式实现的，当需要更新时，就是两个表的数据原子更新，也就是跨表的事务功能，而 Hbase 只提供行级事务，没有跨表和跨行的事务功能，这就需要开发者自己去实现，如果对数据一致性要求较高，那么就可能需要自己去实现一套分布式的事务机制，之所以是分布式的事务机制，是因为原始数据可能由一些 HRegionserver 维护，而索引表由另外一些 HRegionserver 维护，这个事务机制就涉及到了多个HRegionserver，也就是分布式的事务机制。二级索引设
复制链接

扫一扫