关于一致性hash,这可能是全网最形象生动最容易理解的文档,想做架构师的你来了解一下

问题提出

一致性hash是什么?假设有4台缓存服务器N0,N1,N2,N3,现在有数据OBJECT1,OBJECT2,OBJECT3,OBJECT4,OBJECT5,OBJECT5,OBJECT7,OBJECT8,我们需要将这些数据缓存到这4台服务器上,相应的问题是

如何设计数据存放策略?即ObjectX 应该存放在哪台服务器上?

为了解决这个问题,我们有如下几个思路。

1. 余数hash方案

采用hash(Objectx)%4来确定服务器节点

假设 hash(OBJECT1)=2,由 2%4=2,可知,Object1则应该存放到节点N2上假设 hash(OBJECT2)=3,由 3%4=3,可知,Object2则应该存放到节点N3上假设 hash(OBJECT3)=1,由 1%4=1,可知,Object3则应该存放到节点N1上假设 hash(OBJECT4)=0,由 1%4=1,可知,Object4则应该存放到节点N0上假设 hash(OBJECT5)=5,由 5%4=1,可知,Object5则应该存放到节点N1上假设 hash(OBJECT6)=6,由 6%4=2,可知,Object6则应该存放到节点N2上假设 hash(OBJECT7)=7,由 7%4=3,可知,Object7则应该存放到节点N3上假设 hash(OBJECT8)=8,由 8%4=0,可知,Object8则应该存放到节点N0

假设我们需要读取Object3的数据,则由hash(object3)=1可知,我们只需要访问节点N1即可。

1.1 现在假设N3忽然故障下线

我们面临缓存重新构造的问题

采用hash(Objectx)%3来确定服务器节点

假设 hash(OBJECT1)=2,由 2%3=2,可知,Object1则应该存放到节点N2上假设 hash(OBJECT2)=3,由 3%3=0,可知,Object2则应该存放到节点N0上假设 hash(OBJECT3)=1,由 1%3=1,可知,Object3则应该存放到节点N1上假设 hash(OBJECT4)=0,由 0%3=0,可知,Object4则应该存放到节点N0上假设 hash(OBJECT5)=5,由 5%3=2,可知,Object5则应该存放到节点N2上假设 hash(OBJECT6)=6,由 6%3=0,可知,Object6则应该存放到节点N0上假设 hash(OBJECT7)=7,由 7%3=1,可知,Object7则应该存放到节点N1上假设 hash(OBJECT8)=8,由 8%3=2,可知,Object8则应该存放到节点N2

此时为了保证数据的准确性,我们需要将数据Object2N3迁移到N0将数据Object5N1迁移到N2将数据Object6N2迁移到N0将数据Object7N3迁移到N1将数据Object8N0迁移到N2

 

1.2 现在假设我们添加一台新的服务器N4

我们面临缓存重新构造的问题

采用hash(Objectx)%5来确定服务器节点

假设 hash(OBJECT1)=2,由 2%5=2,可知,Object1则应该存放到节点N2上假设 hash(OBJECT2)=3,由 3%5=3,可知,Object2则应该存放到节点N3上假设 hash(OBJECT3)=1,由 1%5=1,可知,Object3则应该存放到节点N1上假设 hash(OBJECT4)=0,由 0%5=0,可知,Object4则应该存放到节点N0上假设 hash(OBJECT5)=5,由 5%5=0,可知,Object5则应该存放到节点N0上假设 hash(OBJECT6)=6,由 6%5=1,可知,Object6则应该存放到节点N1上假设 hash(OBJECT7)=7,由 7%5=2,可知,Object7则应该存放到节点N2上假设 hash(OBJECT8)=8,由 8%5=3,可知,Object8则应该存放到节点N3

此时为了保证数据的准确性,我们需要

将数据Object2N3迁移到N0将数据Object5N1迁移到N0将数据Object6N2迁移到N1将数据Object7N3迁移到N2将数据Object8N0迁移到N3

从上述俩种情况可以看出,一旦机器数目变化,我们面临大量的缓存变化问题,换言之,缓存大部分失效,很可能会导致雪崩。

2.一致性hash方案

现在我们更换如下策略

0 <(objectx)%8<=2 ,则存放在 N0
2 <(objectx)%8<=4 ,则存放在 N1
4 <(objectx)%8<=6 ,则存放在 N2
6 <(objectx)%8<=8 ,则存放在 N3 

2.1 现在假设N3忽然故障下线

我们面临缓存重新构造的问题,调整策略如下

0 <(objectx)%8<=2 ,则存放在 N0
2 <(objectx)%8<=4 ,则存放在 N1
4 <(objectx)%8<=6 ,则存放在 N2
6 <(objectx)%8<=8 ,则存放在 N0 

此时为了保证数据的准确性,我们需要将数据ObjectXN3迁移到N0,受影响的数据仅仅N3相关的数据。

2.2 现在假设我们添加一台新的服务器N4

我们面临缓存重新构造的问题,调整策略如下

0 <(objectx)%8<=2 ,则存放在 N0
2 <(objectx)%8<=4 ,则存放在 N1
4 <(objectx)%8<=5 ,则存放在 N2
5 <(objectx)%8<=6 ,则存放在 N4
6<(objectx)%8 <=8 ,则存放在 N3 

此时为了保证数据的准确性,我们需要将数据从N2复制到N4,受影响的仅仅N2相关的用户。

比较上述俩种做法,可见方案2更优. 方案2就是一致性hash

2.3 缺点

机器越少,则每台机器上负载将越不均匀,解决这个问题的方法是添加虚拟节点,调整策略,如下,可以想象,数据越多,分布越均匀。

0 <(objectx)%8<=1 ,则存放在 N0
1 <(objectx)%8<=2 ,则存放在 N1
2 <(objectx)%8<=3 ,则存放在 N2
3 <(objectx)%8<=4 ,则存放在 N3
4 <(objectx)%8<=5 ,则存放在 N0
5<(objectx)%8 <=6 ,则存放在 N1
6 <(objectx)%8<=7 ,则存放在 N2
7 <(objectx)%8<=8 ,则存放在 N3 

3. 一致性Hash原理

原理网络上太多,这里不做进一步阐述。

 

推荐阅读

扫微信二维码实现网站登陆提供体验地址和源代码

开源项目golang go语言后台管理框架restgo-admin

支持手势触摸,可左右滑动的日历插件

你必须知道的18个互联网业务模型

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值