认识一致性哈希

最新推荐文章于 2024-06-03 11:54:33 发布

Mr_Zhang_Zhen

最新推荐文章于 2024-06-03 11:54:33 发布

阅读量124

点赞数

分类专栏： java算法左神基础班

本文链接：https://blog.csdn.net/Mr_zhang66/article/details/109513437

版权

java算法左神基础班专栏收录该内容

28 篇文章 4 订阅

订阅专栏

工程师常使用服务器集群来设计和实现数据缓存，以下是常见的策略：
、

无论是添加、查询还是删除数据，都先将数据的id 通过哈希函数换成一个哈希值，记为key
如果目前机器有N台，则计算 key%N 的值，这个值就是该数据所属的机器编号，无论是添加、删除还是查询
操作，都只在这台机器上进行。
请分析这种缓存策略可能带来的问题，并提出改进的方案。

题目中描述的缓存从策略的潜在问题是：如果增加或删除机器时（N变化）代价会很高，所有的数据都不得不根据
id重新计算一遍哈希值，并将哈希值对新的机器数进行取模，然后进行大规模的数据迁移。

为了解决这些问题，下面介绍一下一致性哈希算法，这是一种很好的数据缓存设计方案。我们假设数据的id通过哈
希函数转换成的哈希值范围是2^{32，也就是0~(2}32)-1的数字空间中。现在我们可以将这些数字头尾相连，想象成一个闭合的环形，那么一个数据id在计算出哈希值之后认为对应到环中的一个位置上，如图所示
在这里插入图片描述
接下来想象有三台机器也处在这样一个环中，这三台机器在环中的位置根据机器id（主机名或者主机IP，是主机唯
一的就行）设计算出的哈希值对2^32取模对应到环上。那么一条数据如何确定归属哪台机器呢？我们可以在该数据
对应环上的位置顺时针寻找离该位置最近的机器，将数据归属于该机器上：

在这里插入图片描述
将机器m1的ip弄到哈希函数中，并对应到环上

其经过哈希函数计算之后，会得到一个哈希值，这个时候不进行取余（一致性哈希结构不存在取余）
得到的一个哈希值会打到环上的位置！
接着顺时针找到距离最近的机器。
在这里插入图片描述
假设机器的哈希值如下：

然后假设一个字符串“zuo”算出来的哈希值是 136
然后用二分的方法，进行查找
先打到9，然后打到130，然后打到270，即“zuo”应该用m4，这就是顺时针找到离其最近距离的方法
在这里插入图片描述