数据存储与划分原则

最新推荐文章于 2024-01-22 08:50:09 发布

架构成长指南

最新推荐文章于 2024-01-22 08:50:09 发布

阅读量1.1k

点赞数

分类专栏：数据库中间件 mysql 文章标签：数据库中间件分库分表数据库分布式数据库

本文链接：https://blog.csdn.net/dweizhao/article/details/109481268

版权

7 篇文章 0 订阅

订阅专栏

3 篇文章 0 订阅

订阅专栏

前两节对分库分表和遇到一些问题进行解释和总结，本节对分库分表的数据存储和划分原则进行一个讲解

分别是：

下面对常用的分片进行一个介绍

优点：此分片规则在扩容时只需要添加节点，指定日期范围，可以避免扩容时的数据迁移,

例如：表test规划了两个节点分别为db1、db2，db1存储2015.12之前的数据，db2存储2016.1-2016.6的数据，当时间达到2016.6以后，现有分片规则无法满足，所以就面临分片的增加，一般分片的增加需要进行数据迁移，而基于范围的分片规则，只需增加2016.7 -2016.12即可，不需要对以前的数据进行迁移。
缺点：负载不均衡

如2015.12以前这个业务发展不是特别快，数据量相对不大，但是以后随着营销和推广，业务飞速发展，那么2016.1-2016.6这个节点数据量就相对比较大。

根据分片键的值进行hash，并根据节点数进行取余

按照常用的hash算法来将对应的key哈希到一个具有2^{32次方个桶的空间中，即0~(2}32)-1的数字空间中。现在我们可以将这些数字头尾相连，想象成一个闭合的环形.

首先求出数据库节点的哈希值，并将其配置到0-2^32圆上，如
1. Hash(NODE1) = KEY1=2^10;
2. Hash(NODE2) = KEY2=2^20;
3. Hash(NODE3) = KEY3=2^30;
然后采用同样的方法求出存储数据的键的哈希值，并映射到相同的圆上。
然后从数据映射到的位置开始顺时针查找，将数据保存到找到的第一个服务器上。如果超过2^32仍然找不到服务器，则从0开始查找。
4. 示例：
根据用户ID分片，流水号规则为UR+12位序号,如UR000000000013, 进行hash计算为2^5，则属于NODE1

关注