Hbase rowkey设计与实际使用

最新推荐文章于 2022-04-19 14:11:40 发布

vip9850

最新推荐文章于 2022-04-19 14:11:40 发布

阅读量287

点赞数

分类专栏： 52hbase

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/vip9850/article/details/105493668

版权

52hbase 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

Hbase 设计

相同IO特性的Column放在一个Column Family会更高效

时间序列数据：

以时间作为key 和value作为列（可以设置不同相关度的数据为一个列簇）

1 减少行数，用更宽的行（数据量一定的情况更宽的行可以减少行数，因为你可能两张表各存储1亿，这样检索两亿，但要是放到一张表，它就只用检索1亿个rowkey ）可以更快的扫描。宽行并不能节省空间。物理存储还是会展开的，不过在逻辑扫描行的时候减少了行数。

2利用单行偏移量，减少行数让一行存储更多数据，1提高扫描速度，同时每行可以更快的获得更多数据。

3节省空间：列合并，可以减少列数，相应减少列的rowkey副本数而节省空间。

在每个keyvalue中存储更多的数据。每个列都会包含一个rowkey，key是重复存储的，每列都有key的副本。

1不要用 htable 和htablepool 在appserver中因为他们都是同步的，在高并发性能低

推荐使用

Async hbase 基于hbase的异步实现库+ netty or finagle 高并发的开源server

3 每个regionserver 管理的regions不要太多，会导致挂掉恢复成本很高

Key设计：

1key一定要是等长的，变长扫描起来很低效

2进行组合key设计， metric+时间戳对metric（监控项）进行枚举表编码，这样可以节省大量磁盘空间

3 Rowkey的散列原则，防止出现热点

Rowkey设计原则

1.Rowkey的唯一原则

2. Rowkey的排序原则

3. Rowkey的散列原则

Region热点问题：

1、Rowkey反转

2、Rowkey前缀加Salt加盐

3、Hash散列让一个给定的行有相同的前缀，这在分散了Region负载的同时，使读操作也能够推断。

4Rowkey的-短原则

其一是HBase的持久化文件HFile是按照KeyValue存储的，

其二是MemStore缓存部分数据到内存，Rowkey过长内存的利用率会降低

做Rowkey设计时，先考虑业务是读比写多、还是读比写少，即便HBase为写优化，也可能出现热点问题，如果我们读比较多，除了考虑以上Rowkey设计原则外，还可以考虑HBase的Coprocessor甚至elastic search结合的方法，无论哪种方式，都建议做实际业务场景下数据的压力测试以得到最优结果

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Hbase rowkey设计与实际使用

Hbase 设计相同IO特性的Column放在一个Column Family会更高效时间序列数据：以时间作为key 和value作为列（可以设置不同相关度的数据为一个列簇） 1 减少行数，用更宽的行（数据量一定的情况更宽的行可以减少行数，因为你可能两张表各存储1亿，这样检索两亿，但要是放到一张表，它就只用检索...
复制链接

扫一扫

专栏目录

vip9850 CSDN认证博客专家 CSDN认证企业博客

码龄8年

13: 原创

29万+: 周排名

122万+: 总排名

9033: 访问

: 等级

165: 积分

0: 粉丝

1: 获赞

1: 评论

15: 收藏

私信

关注

热门文章

分类专栏

最新评论

eclpse下j2ee项目 tomcat 报 Initializing Spring root WebApplicationContext 项目无法启动
CSDN-Ada助手: 非常感谢您的分享！这是一个常见的问题，我建议您可以继续写一篇关于如何解决“Initializing Spring root WebApplicationContext”报错的博客，特别是在eclipse下j2ee项目tomcat运行中的具体解决方法和注意事项。这样的技术文章对其他用户也会非常有帮助，相信会有更多读者受益于您的分享。期待您的下一篇博客！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。