分布式存储--常见分区算法

最新推荐文章于 2024-05-22 16:32:48 发布

NCS123456

最新推荐文章于 2024-05-22 16:32:48 发布

阅读量1.5k

点赞数

分类专栏：分布式文章标签：分区算法一致性hash 分区

本文链接：https://blog.csdn.net/NCS123456/article/details/98478084

版权

11 篇文章 0 订阅

订阅专栏

随着请求量和数据量的增加，一台机器已经无法满足需求，我们就需要把数据和请求分散到多台机器。我们就需要引入分布式存储。分布式存储有以下特性：

分布式存储首先要解决把整个数据集按照分区规则映射到多个节点的问题，即把数据集划分到多个节点上，每个节点负责整体数据的一个子集。

范围分区将数据基于范围映射到每一个分区，这个范围是你在创建分区时指定的分区键决定的。数据库中这种分区方式是最为常用的，并且分区键经常采用日期。

一般是通过数据的某个特征计算哈希值，并将哈希值与集群中的服务器建立映射关系，从而将不同数据分布到不同服务器上。

hash(object) % N

实现思路是为系统中每个节点分配一个token，范围一般在0~2^32，这些token构成一个哈希环。数据读写执行节点查找操作时，先根据key计算hash值，然后顺时针找到第一个大于等于该哈希值的token节点。如图

在一致性hash分区的基础上加入了，虚拟槽（slot）的概念，通过 virtual slot 将哈希环分割成更小的粒度，小粒度的 slot 块被不同的 node 持有。

DDB就使用了虚拟槽分区的概念，把hash表均匀的映射到数据节点，通过balanceId计算hash，对应hashtable找到对应的数据节点。

关注

专栏目录