通过题目解释一致性哈希算法的基本原理

最新推荐文章于 2024-05-14 22:57:32 发布

追求大牛之人

最新推荐文章于 2024-05-14 22:57:32 发布

阅读量4.4k

点赞数 1

本文链接：https://blog.csdn.net/weixin_43895254/article/details/111028369

版权

工程师常使用服务集群来设计和实现数据缓存，以下是常见的策略。

分析这种缓存策略可能带来的问题，并提出解决方案。

首先说这种方法的问题，如果N变化，代价会很高，所有的数据不得不根据id重写计算一遍哈希值，并将哈希值对新的机器数进行取模操作，然后进行大规模的数据迁移。

为了解决这些问题，就要用到一致性哈希算法：

假设数据的id通过哈希函数转换成的哈希值范围是2^{32,也就是0~（2}32）-1的数字空间中。现在我们可以将这些数字头尾相连，想象成一个闭合的环形，那么一个数据id在计算出哈希值之后认为对应到环中的一个位置上。
接下来想象有三台机器也处在这样一个换种，这三台机器在环中的位置根据机器id计算出的哈希值来决定。然后是将数据归属到机器上，，根据数据的id计算出哈希值，并映射到环中相应的位置，然后顺时针找寻离这个位置最近的机器，那台机器就是数据的归属。
所以在环中添加一台机器，只需要把新机器与逆时针的寻到的那台机器之间的数据迁移到新机器即可。

ps：这个过程可能出现数据倾斜问题，可以通过引入虚拟节点机制来解决

关注