分布式知识总结（一致性Hash算法）

程序员清风

已于 2024-08-13 10:27:11 修改

阅读量231

点赞数 6

文章标签：算法分布式哈希算法

于 2024-08-13 10:27:04 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_35508033/article/details/141157276

版权

文章收录在网站：http://hardyfish.top/

文章收录在网站：http://hardyfish.top/

文章收录在网站：http://hardyfish.top/

文章收录在网站：http://hardyfish.top/
在这里插入图片描述

一致性Hash算法

假如有三台服务器编号node0、node1、node2，现在有3000万个key，希望可以将这些个key均匀的缓存到三台机器上？

可以使用取模算法hash（key）% N，对key进行hash运算后取模，N是机器的数量。

但服务器数量N发生变化后hash（key）% N计算的结果也会随之变化。

在这里插入图片描述

一致性hash算法本质上也是一种取模算法，不过不同于上边按服务器数量取模，一致性hash是对固定值2^32取模。

IPv4的地址是4组8位2进制数组成，所以用2^32可以保证每个IP地址会有唯一的映射。

将这2^32个值抽象成一个圆环，圆环的正上方的点代表0，顺时针排列，以此类推，1、2、3、4、5、6……直到2^32-1，而这个由2的32次方个点组成的圆环统称为hash环。

在这里插入图片描述

服务器映射到hash环:

使用服务器IP地址进行hash计算，用哈希后的结果对2^32取模，结果一定是一个0到2^32-1之间的整数，而这个整数映射在hash环上的位置代表了一个服务器，依次将node0、node1、node2三个缓存服务器映射到hash环上。

一致性hash的优势：

假如业务量激增，系统需要进行扩容增加一台服务器node-4，刚好node-4被映射到node-1和node-2之间，沿顺时针方向对象映射节点，发现原本缓存在node-2上的对象key-4、key-5被重新映射到了node-4上，而整个扩容过程中受影响的只有node-4和node-1节点之间的一小部分数据。

假如node-1节点宕机，沿顺时针方向对象映射节点，缓存在node-1上的对象key-1被重新映射到了node-4上，此时受影响的数据只有node-0和node-1之间的一小部分数据。

数据偏斜问题：

在服务器节点数量太少的情况下，很容易因为节点分布不均匀而造成数据倾斜问题，被缓存的对象大部分缓存在node-4服务器上，导致其他节点资源浪费，系统压力大部分集中在node-4节点上，这样的集群是非常不健康的。

一致性Hash算法引入了一个虚拟节点机制，即对每个服务器节点计算出多个hash值，它们都会映射到hash环上，映射到这些虚拟节点的对象key，最终会缓存在真实的节点上。

在这里插入图片描述

一致性hash的应用场景：

一致性hash在分布式系统中应该是实现负载均衡的首选算法，比如日常使用较多的缓存中间件memcached和redis集群都有用到它。

程序员清风

关注

6
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
分布式知识总结（一致性Hash算法）

机制，即对每个服务器节点计算出多个hash值，它们都会映射到hash环上，映射到这些虚拟节点的对象key，最终会缓存在真实的节点上。一致性hash算法本质上也是一种取模算法，不过不同于上边按服务器数量取模，一致性hash是对固定值。个值抽象成一个圆环，圆环的正上方的点代表0，顺时针排列，以此类推，1、2、3、4、5、6……之间的整数，而这个整数映射在hash环上的位置代表了一个服务器，依次将。服务器上，导致其他节点资源浪费，系统压力大部分集中在。节点宕机，沿顺时针方向对象映射节点，缓存在。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。