redis数据倾斜

本文详细探讨了数据倾斜的两种类型——数据量倾斜与数据访问倾斜,包括bigkey导致的倾斜、slot分配不均引发的问题以及HashTag带来的热点数据问题。提供了解决策略,如拆分bigkey、调整slot分配和客户端处理HashTag。针对热点数据,讨论了只读与读写场景下的应对方法。
摘要由CSDN通过智能技术生成

数据倾斜分为两种:
1.数据量倾斜:在某些情况下,实例上的数据分布不均匀,某个实例上的时候特别多。
2.数据访问倾斜:虽然每个实例上的数据量差别不大,但是某个实例上的数据是热点数据,被访问的非常频繁。

数据倾斜的成因和应对方案:

1.bigkey导致倾斜
bigkey的value很大或者bigkey中保存大量的集合元素,会导致这个实例的数据量增加,内存消耗也相应的增加
bigkey造成实例io线程阻塞,如果bigkey的访问量较大,就会影响这个实例上其他请求的处理速度。
解决办法:1.避免过多的数据对保存在同一键值对上。 2.把bigkey拆分成小的集合类型数据,分散在不同实例上。
举个例子:如果Hash集合user:info保存100万个用户信息,是一个bigkey。我们就可以按照用户id范围,把这个集合拆分成10个集合。每个集合只保留10万用户的信息。

2.Slot分配不均衡导致倾斜
Redis Cluster查看slot分配情况的命令:CLUSTER SLOTS

3.Hash Tag导致倾斜
数据通过key计算的CRC16值,分配到相应的Slot,而如果使用Hash Tag,原本的key是user:profile:3231就会变成user:profile:{3231},而计算CRC16也只是根据花括号里的值进行的计算。如果不同的key花括号中的值一样就会被分派到同一个slot中,
这样设计的好处就是:支持事务操作和范围查询,但是会导致大量数据被集中到了一个实例上,导致数据倾斜集群的负载不均衡。
解决的办法:舍弃Hash Tag进行数据切片,而是放在客户端进行执行。

数据访问倾斜的原因和应对方案:

热点数据会存在于某个实例中,那么,这个实例的访问量会远高于其他实例。
在这里插入图片描述
如果热点数据是只读的话,采用热点数据多副本的方案,在每一个副本的key中增加一个随机前缀,让它和其他副本数据不会映射到同一slot中。
如果热点数据是读写的话,就不能采用以上方法,因为为了保证数据的一致性,会带来额外的开销。解决的办法就是使用配置更高的机器。

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值