一致性hash算法

最新推荐文章于 2021-03-30 18:07:40 发布

走在小路

最新推荐文章于 2021-03-30 18:07:40 发布

阅读量356

点赞数

文章标签： hash 一致性哈希

原文链接：https://blog.csdn.net/suifeng629/article/details/103686061

版权

数据分片

✔︎ 先让我们看一个例子吧

我们经常会用 Redis 做缓存，把一些数据放在上面，以减少数据的压力。

当数据量少，访问压力不大的时候，通常一台Redis就能搞定，为了高可用，弄个主从也就足够了；

当数据量变大，并发量也增加的时候，把全部的缓存数据放在一台机器上就有些吃力了，毕竟一台机器的资源是有限的

通常我们会搭建集群环境，让数据尽量平均的放到每一台 Redis 中，比如我们的集群中有 4 台Redis。

那么如何把数据尽量平均地放到这 4 台Redis中呢？最简单的就是取模算法：

hash( key ) % N，N 为 Redis 的数量，在这里 N = 4 ;

看起来非常得美好，因为依靠这样的方法，我们可以让数据平均存储到 4 台 Redis 中，当有新的请求过来的时候，我们也可以定位数据会在哪台 Redis 中，这样可以精确地查询到缓存数据。

02

数据分片会遇到的问题

但是 4 台 Redis 不够了，需要再增加 4 台 Redis ；那么这个求余算法就会变成：hash( key ) % 8 ；

那么可以想象一下，当前大部分缓存的位置都会是错误的，极端情况下，就会造成缓存雪崩。

03

一致性 Hash 算法

一致性 Hash 算法可以很好地解决这个问题，它的大概过程是这样的：

把 0 作为起点，2^32-1 作为终点，画一条直线，再把起点和终点重合，直线变成一个圆，方向是顺时针从小到大。0 的右侧第一个点是 1 ，然后是 2 ，以此类推。

对三台服务器的 IP 或其他关键字进行 hash 后对 2^32 取模，这样势必能落在这个圈上的某个位置，记为 Node1、Node2、Node3。

然后对数据 key 进行相同的操作，势必也会落在圈上的某个位置；然后顺时针行走，可以找到某一个 Node，这就是这个 key 要储存的服务器。

如果增加一台服务器或者删除一台服务器，只会影响部分数据。

但如果节点太少或分布不均匀的时候，容易造成数据倾斜，也就是大部分数据会集中在某一台服务器上。

为了解决数据倾斜问题，一致性 Hash 算法提出了【虚拟节点】，会对每一个服务节点计算多个哈希，然后放到圈上的不同位置。

当然我们也可以发现，一致性 Hash 算法，也只是解决大部分数据的问题。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

走在小路 CSDN认证博客专家 CSDN认证企业博客

码龄14年

39: 原创

2万+: 周排名

134万+: 总排名

138万+: 访问

: 等级

1万+: 积分

610: 粉丝

959: 获赞

224: 评论

4640: 收藏

私信

关注

热门文章

分类专栏

前端 2篇

最新评论

一致性Hash(Consistent Hashing)原理剖析及Java实现
Jin-sir: 引用「环的中间的整数按逆时针分布」有的文章说是顺时针，有的说是逆时针。到底谁说的对呢？
[log4j]log4j在程序中指定输出日志文件名（一）
IT罗: 引用「https://blog.csdn.net/zhaofmyan/article/details/68」运行一段时间后，日志出现覆盖，重启业务后会正常，然后运行一段时间后又出现覆盖问题。。。。咋处理
手把手教你实现mysql读写分离+故障转移
失败的救赎: 想提问一下，读写分离的时候，主从节点都是用ip写死在代码里的，那么主库如果宕机了，就算是其他从库当了主库，它的ip在代码里也是从库的IP啊
CPU突然飙升，如何排查
loading······: 原链接有没，这个排版看的头疼
[分布式]如何设计一个百万级用户的抽奖系统
菜鸡起飞: 那对于抽奖系统，要保证所有用户都有被抽到的公平性，那这时就不能SLB进行限流了，这时有什么方案抗住这样的大流量吗？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。