企业级Redis开发运维从入门到实践（30）— Redis Cluster（集群）的数据分布

最新推荐文章于 2023-09-22 19:08:09 发布

迷途码界

最新推荐文章于 2023-09-22 19:08:09 发布

阅读量360

点赞数

分类专栏： Redis 文章标签：企业级Redis开发运维从入门到实践 Redis Cluster（集群）的数据分布节点取余分区一致性哈希分区虚拟槽分区

本文链接：https://blog.csdn.net/zx711166/article/details/83346003

版权

38 篇文章 5 订阅

订阅专栏

分布式数据库首先要解决把整个数据集按照分区规则映射到多个节点的问题，即把数据集划分到多个节点上，每个节点负责整体数据的一个子集。

分布式存储数据分区：
在这里插入图片描述

常见的分区规则：

分区方法	特点	代表产品
哈希分区	离散度好数据分布业务无关无法顺序访问	Redis Cluster Cassandra Dynamo
顺序分区	离散度易倾斜数据分布业务相关可顺序访问	Bigtable HBase Hypertable

由于Redis Cluster采用哈希分区规则，下面分别介绍常见的几种哈希分区规则。

公式： hash(key)%N （使用特定的数据，如Redis的键或用户ID，再根据节点数量N使用），计算出哈希值，用来决定数据映射到哪一个节点上。
存在一个问题：当节点数量变化时，如扩容或收缩节点，数据节点映射关系需要重新计算，会导致数据的重新迁移。
突出优点：是简单性，常用于数据库的分库分表规则，一般采用预分区的方式，提前根据数据量规划好分区数，比如划分为512或1024张表，保证可支撑未来一段时间的数据量，再根据负载情况将表迁移到其他数据库中。扩容时通常采用翻倍扩容，避免数据映射全部被打乱导致全量迁移的情况。

在这里插入图片描述

每个节点分配一个token，范围一般在0~ $2^{23}$ ，这些token构成一个哈希环。数据读写执行节点查找操作时，先根据key计算hash值，然后顺时针找到第一个大于等于该哈希值的token节点。

在这里插入图片描述

这种方式相比节点取余最大的好处在于加入和删除节点只影响哈希环中相邻的节点，对其他节点无影响。
在这里插入图片描述

虽然减少了影响，但是还是会存在的一些问题：

加减节点会造成哈希环中部分数据无法命中，需要手动处理或者忽略这部分数据（下图所示），因此一致性哈希常用于缓存场景（上图中 n1~n5 之间的数据无法在 n5 节点访问 [数据漂移]，只能通过 n2 节点访问）。
当使用少量节点时，节点变化将大范围影响哈希环中数据映射，因此这种方式不适合少量数据节点的分布式方案。
普通的一致性哈希分区在增减节点时需要增加一倍或减去一半节点才能保证数据和负载的均衡。