一、背景
一个设计良好的分布式哈希方案应该具有良好的单调性,即服务节点的增减不会造成大量哈希重定位;常见的缓存情况:在分布式缓存集群中,对机器的添加删除,或者机器故障后自动脱离集群这些操作是分布式集群管理最基本的功能。如果采用常用的hash(object)%N算法,那么在有机器添加或者删除后,很多原有的数据就无法找到了;具体案例如下:
object.hashCode()% 4。
Cache 0: object.hashCode() % 4 == 0 |
Cache 1: object.hashCode() % 4 == 1 |
Cache 2: object.hashCode() % 4 == 2 |
Cache 3: object.hashCode() % 4 == 2 |
看起来一切正常,考虑下面两种情况:
1:由于Cache3硬件损坏,所有Cache3上的缓存都失效了,需要把Cache3移除。
2:由于负载已经无法承担业务增涨,决定添加一台Cache服务器。
二、算法基本原则
平衡性(Balance):平衡性是指Hash的结果能够尽可能分布均匀,充分利用所有缓存空间;单调性(Monotonicity):单调性是指如果已经有一些内容通过哈希分派到了相应的缓冲中,又有新的缓冲加入到系统中。哈希的结果应能够保证原有已分配的内容可以被映射到新的缓冲中去,而不会被映射到旧的缓冲集合中的其他缓冲区。
分散性(Spre