场景:需要把100张图片,存到3个服务器中。
1、固定hash算法。
将hash(图片名称)%N,N一般是机器数。
如果原来是3台机器,加了一台机器,就变成了hash(图片名称)%4,这样大部分的数据都需要进行迁移。
固定hash算法的缺点是,当机器数目变化时,大量的数据需要迁移。
2、一致性hash算法
为了解决这个问题,一致性hash算法:
(1)第一步,也是将hash(图片名称)%(2^32)
(2)第二步,hash(机器名称)%(2^32)
将(2^32)想象成一个环,0是开始,(2^32-1)是末尾,根据公式,把图片和机器映射到hash环上,从图片的位置开始,沿顺时针方向遇到的第一个服务器,就是图片将会被缓存的服务器。
在图上可以看到,1,2将会被缓存在A服务器上,3被缓存在B服务器上,4被缓存在C服务器上。
一致性hash的优点是,当服务器数量变化时,只有部分缓存会失效
3、虚拟节点
一致性hash时,可能会出现大部分的对象,都缓存在一台机器上,如下图所示
这时,虚拟节点的出现,可以一定程度上解决大部分节点都缓存在一个服务器上这种情况。
虚拟节点:一个实际节点可以对应多个虚拟节点。
例如,上图的话,1,3节点就被缓存在A服务器上。
5,4节点被缓存在B服务器上
2,6节点被缓存在C服务器上
参考文章:
http://www.zsythink.net/archives/1182