前言
hello,大家好,这里是Z宝。今天我们来聊聊一致性 hash 算法在 redis 上的应用。很多小伙伴的公司随着业务量的增长,数据量也在不断的加大,redis缓存也用的越来越多,这时候一台redis,往往解决不了问题,需要多台redis进行分布式存储。一旦涉及到分布式,我们就要考虑数据存储的均衡以及机器宕机带来的数据影响。那么如上,我们就抛出两个问题。第一个,如何使数据均衡的存储在每一个redis服务器上?第二个,当redis某台机器宕机的时候,如何最大限度的减少数据的丢失,减少缓存雪崩的发生。今天我们要聊的一致性hash算法就可以解决这两个问题。
原有问题的仔细分析
首先我们来聊一下传统的负载均衡的一些算法。有轮循算法、哈希算法、故障转移算法等,其中适合存储的负载均衡算法就是hash算法,也是我们比较常用的一种。hash算法的思想就是用某个设计好的hash函数,将我们要存储的数据的唯一标识,计算成一个hash值,然后使用取余的方式将hash值和机器数mod后得到余数,这样我们获得的余数一定在我们的机器中。最后进行存储即可。这个时候我们一想好像没什么问题,数据可以均衡的存储到每台机器上。那么此时如果我有一台机器挂掉了呢?机器数变小,之前的取余全部发生变化,意味着我们之前的缓存全部失效,不能从计算的机器上获取到缓存值了。意味着所有请求的数据即将瞬间打到数据库上,严重的情况下,生产环境直接挂掉。挂掉一台会有这么严重的影响,那么增加一台呢?同样的。增加一台也会导致rehash,缓存大量失效。有些小伙伴们听到这可能有点懵逼了。那我给你们举一个实际的例子。
如果你觉得自己学习