大数据算法-＞一致性哈希算法的基本原理

最新推荐文章于 2024-05-14 22:57:32 发布

空知_月月鸟

最新推荐文章于 2024-05-14 22:57:32 发布

阅读量278

点赞数

分类专栏：笔记大数据文章标签：算法大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44517561/article/details/119743483

版权

本文探讨了在大数据缓存场景下，传统哈希策略的问题，并介绍了使用一致性哈希算法来解决数据迁移代价高和负载不均衡的问题。通过虚拟节点技术，一致性哈希确保了在增减机器时能有效保持数据分布的均衡，降低了系统维护成本。

摘要由CSDN通过智能技术生成

大数据算法->一致性哈希算法的基本原理

需求
解答

需求

工程师常使用服务器集群来设计和实现数据缓存,以下是常见的策略.
1.无论是添加\查询还是删除数据,都先将数据的id通过哈希函数转换成一个哈希值,记为key.

2.如果目前机器有N台,则计算key % N的值,这个值就是该数据所属的机器编号,无论是添加\删除还是查询操作,都只在这台机器上进行.

请分析这种缓存策略可能带来的问题,并提出改进的方案.

解答

需求中描述的缓存策略的潜在问题是如果增加或删除机器(N变化),代价会很高,所有数据都不得不根据id重新一遍哈希值,并将哈希值对新的机器数进行取模操作,然后进行大规模的数据迁移.

为了解决这些问题,下面介绍一致性哈希算法,这是一种很好的数据缓存设计方案.我们假设数据的id通过哈希函数转换成的哈希值范围是2^(32),也就是0 ~ (2^(32))-1的数字空间中.现在我们可以将这些数字头尾相连,想象成一个闭合的环形,那么一个数据id在计算出哈希值之后认为对应到环中的一个位置上,如图1所示
请添加图片描述

接下来想象有三台机器也处在这样一个环中,这三台机器在环中的位置根据机器id计算出的哈希值来决定.那么一条数据如何确定归属哪台机器呢?首先把该数据的id用哈希函数算出哈希值,并映射到环中相应的位置,然后顺时针找寻离这个位置最近的机器,那台机器就是该数据的归属,如图2所示.
在这里插入图片描述

在图2中,data1根据其哈希值为key1,顺时针的第一台机器是machine2,所以data1归属machine2.同理,data2归属machine3,data3和data4

最低0.47元/天解锁文章

空知_月月鸟

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
大数据算法-＞一致性哈希算法的基本原理

大数据算法->一致性哈希算法的基本原理需求解答需求工程师常使用服务器集群来设计和实现数据缓存,以下是常见的策略.1.无论是添加\查询还是删除数据,都先将数据的id通过哈希函数转换成一个哈希值,记为key.2.如果目前机器有N台,则计算key % N的值,这个值就是该数据所属的机器编号,无论是添加\删除还是查询操作,都只在这台机器上进行.请分析这种缓存策略可能带来的问题,并提出改进的方案.解答需求中描述的缓存策略的潜在问题是如果增加或删除机器(N变化),代价会很高,所有数据都不得不根据id
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。