对于分布式缓存来说,当一个节点接收到请求,如果该节点并没有存储缓存值,那么它面临的难题是,从谁那获取数据?
对于同一个Key,我们肯定想将其打到同一台机器上。首先想到的是使用哈希算法,但是,如果直接使用hash值的话会带来较大的问题:
不难看出,少了一台机器之后,如果key对应的hash值是3,4,5的话,查询的机器都会改变,那肯定会调用耗时的降级方法再次加载,所以直接取hash值是不可行的。我们使用一致性哈希算法,示例如下:
不难看出,增加一台机器后,只有一小部分的key会改变机器查询,这就是一致性哈希的优点。但是,这当中也存在一些问题,比如key倾斜的问题,看左图的哈希环不难发现,在4到0的部分明显可能落下更多的key,0号机器的压力变大 ,那这个问题我们怎么解决呢?
我们可以不使用真实节点,而使用虚拟节点,将一个真实节点映射为多个虚拟节点打散起到加盐的效果,维护一个映射最终在映射回真实节点,可以解决倾斜问题。
本轮迭代完成后的效果图应该如下所示: