分布式系统下的哈希一致性算法设计

最新推荐文章于 2021-06-20 18:27:53 发布

「已注销」

最新推荐文章于 2021-06-20 18:27:53 发布

阅读量199

点赞数

分类专栏：算法文章标签：哈希一致性分布式架构设计

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/myfirstcn/article/details/89520532

版权

本文涉及：普通哈希算法存在的问题，分布式系统的哈希一致性算法，哈希一致性算法中的数据倾斜问题

我们知道，在分布式系统中当数据量无法使用单机进行存储时，最简单粗暴的方法就是水平扩展：加机器，搞集群。

然而所有的集群模式都会面临一个数据存放的问题：即一个集群有多台机器，我们怎么知道这次的数据应该放在哪个机器上呢？这次的数据放到了一台机器上我下一次读取的时候能保证还来这台机器上找么？

假如当前我们有一个Redis集群，共5个节点对外提供服务

◆
Hash取模
◆

最开始的解决方案就是首先给5台机器分别编号：1、2、3、4、5
当对一个数据进行操作时首先计算key的hash然后对机器数量5进行取余，得出的余数就是需要放置的机器的编号。

1	key应该放置的机器编号=hash(key) % 5

这个方案完美解决了文章开始提到的两个问题，但是大家都知道，程序员的智力是没有上限，当然主要是因为问题逼的：

如果其中一台机器宕机了、或者新增了服务器，则整个集群所有的数据都需要重新计算位置，这个过程简直不要太痛苦。

◆
一致性Hash
◆

既然出现了问题，聪明的程序员很快就想到了解决方案：一致性哈希算法

最低0.47元/天解锁文章

「已注销」

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分布式系统下的哈希一致性算法设计

本文涉及：普通哈希算法存在的问题，分布式系统的哈希一致性算法，哈希一致性算法中的数据倾斜问题我们知道，在分布式系统中当数据量无法使用单机进行存储时，最简单粗暴的方法就是水平扩展：加机器，搞集群。然而所有的集群模式都会面临一个数据存放的问题：即一个集群有多台机器，我们怎么知道这次的数据应该放在哪个机器上呢？这次的数据放到了一台机器上我下一次读取的时候能保证还来这台机器上找么？假如当...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。