使用key计算出Hash值,然后顺时针找到第一个能够存储数据的节点。比如Object A最终存储在Node A上。通过这样的操作,就可以将数据分散存储到不同的node上。
如果Node C宕机了,则Object C会存储到Node D中。C宕机,受到影响的数据只有Node C到Node B之间的数据,需要重写到D节点中,其他节点的数据不会受到影响。并且当有新的Hash值的B-C的数据进来时,也会保存到D中去。
新增节点后,Object C数据需要重新写入,而别的数据不受影响。新增一台服务器,受影响的数据是由X-B之间的数据,需要重写到X中。
好处:一致性hash算法对于节点的增减只需要重新定位环空间的一小部分数据,具有较好的容错性和扩展性。
数据倾斜问题:被缓存的对象,绝大部分缓存在一台服务器上。
对每个节点服务器计算多个hash值