rowkey设计原则

rowkey是什么?

rowkey相当于mysql、orcale中的主键,用于标识唯一的行,是完全由用户指定的一串不重复的字符串,hbase的数据永远都是根据rowkey的字典顺序排序的。

Rowkey的作用

1)读写数据时通过rowkey找到对应region;2)MenStore中数据按rowkey排序;3)HFile中数据按rowkey排序。

rowkey对region的影响:

hbase的表数据是根据rowkey划分到不同的region,不合理的rowkey会导致热点问题。热点问题就是大量的Client直接访问集群上的某一个节点雄极少数节点,而其它节点却处于空闲状态。如果某个region的访问频率过高,会影响这个region所在机器的其他region。

rowkey设计技巧

1)Salting(加盐):rowkey前面加随机数,使它和之前的排序不同。

2)Hashing:把rowkey哈希后,将哈希后的部分字符当成rowkey的头部和原来的rowkey进行拼接。

3)Reversing:反转一段固定长度和全部的键作为rowkey。(适用于,数据太分散,但rowkey后面的字符相同,如url,后缀均为.com)

rowkey长度:

rowkey可以是任意的字符串,最大长度为64k,建议越短越好。

1)数据储存到HFile是按key-value存储的,如果rowkey过长,会影响HFile的存储效率。

2)MenStore会存储部分数据到内存,如果rowkey过长,内存利用率就会下降,系统不能存储更多的数据,还会降低检索效率。

转载于:https://www.cnblogs.com/ww5566/p/11496455.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值