Hbase-热点问题(数据存储倾斜问题)

1. 危害

某一台regionserver消耗过多,承受过多的并发量,时间长机器性能下降,甚至宕机

 2. 解决

可以通过设计rowkey+预分区的方法解决

比如可以预分区120个,1月的数据存到1-10分区,每个月的数据存到10个分区,而这10个分区是归不同的regionserver管的,所以不会产生数据倾斜。

那怎么让1月的数据存到1-10分区呢?就需要对rowkey进行设计了,设计的规则如下:

rowkey设计三个原则:

  1. 唯一性:相当于主键
  2. 长度性:16k,不要过长
  3. 散列性:hash, 加盐 ,字符串反转
                    (rowkey.hashcode % 分区数)_rowkey
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值