这篇文章我们来了解一下各种数据分布算法,以redis作为数据分布的机器来举例
- hash算法
首先是最简单的hash算法,假如我们有三台redis服务器,这时来了一个key,我们会先对key进行hash计算,然后根据机器数量进行取模,得出的结果就是机器的一个编号,就将key发送到这台机器上去
如果这时突然有一台机器宕机了,那么一时间这台机器上所有的缓存都失效了,那么请求就会直接打到MySQL上,如果数据量太大,会导致MySQL也宕机
即使MySQL抗住了这些请求,之后的key在进行hash算法的时候,也需要重新进行取模,因为机器的数量变了,从而导致大部分的缓存都会失效,大量的key重新分配
- 一致性hash算法
一致性hash算法有一个hash环的概念,每个key的hash值会对2^32 进行取模,最终保证每个计算出的值都在这个hash环上
而我们的redis机器也会根据ip地址的hash值对2^32进行取模,最后也是在这个hash环上,计算出的key值在hash环上顺时针找到的第一个机器,key就会发到这台机器上
在遇到上面的hash算法的节点宕机问题时,原先节点上的key会顺时针的找到下一个节点,只有原先在这个节点上的key会失效,大部分的key并不会受到影响