数据优化——分库分表（二）策略讲解

CabbageDevil

已于 2022-05-18 20:51:12 修改

阅读量763

点赞数

分类专栏：分库分表 java 架构文章标签：哈希算法数据库架构 java

于 2022-05-05 20:48:26 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bcdmw233/article/details/124596585

版权

java 同时被 3 个专栏收录

23 篇文章 2 订阅

订阅专栏

10 篇文章 0 订阅

订阅专栏

3 篇文章 0 订阅

订阅专栏

数据优化——分库分表（一）概念及运用场景-详解
 数据优化——分库分表（三）中间件讲解
 数据优化——分库分表（四）高级策略

1 range

自增ID，根据ID范围进行分表（左闭右开）

比如1~1000000是table1；
1000001~2000000是table2；
2000001~3000000table3；

优点：

id是⾃增⻓，可以⽆限增⻓
扩容不⽤迁移数据，容易理解和维护

缺点：

⼤部分读和写都访会问新的数据，有IO瓶颈，整体资源利⽤率低。
数据倾斜严重，热点数据过于集中，部分节点有瓶颈

比如：做一个用户数据，用户肯定是越新越活跃，一般来说老用户的活跃程度没有新用户的高，所以按上面的分库分表方法的话会导致后面的库表压力大，前面的库表压力小，造成缺点的产生。

适合： 日活流水记录（需要新旧数据整合）

1.1 拓展-range延伸

按上面的来看，感觉range策略很鸡肋的样子，其实也不然，因为没有万能的策略，只有适合的策略。通过上面可以看出range其实是一个一定范围内的划分（看单词含义就应该知道）。而这个范围不应该限定于数字之间，可以把它延伸扩展。例如：

时间年、⽉、⽇范围，比如按照⽉份⽣成库或表 pay_log_2022_01、pay_log_2022_02
空间地理位置：省份、区域（华东、华北、华南）⽐如按照省份⽣成库或表

思考1 ：为什么按地域分的时候多按（华东、华北、华南）而不是直接按省份建表建库？
在这里插入图片描述

答案1：如果是按省份建表建库也会导致上面说的“有IO瓶颈，整体资源利⽤率低”等问题，因为省份之间的数据量是不一样的，拿广西跟北上广比，从用户使用频率到使用量基本是有倍数上的差距，如果广西一个库，上海一个库，那就会导致广西的库性能过剩，上海的库性能告急。所以按地域划分，可以均匀些，把各大冷热数据均摊，提高机器的使用率。比如扩大到世界范围时候，也不会按各大洲各大国去划分，而是按经纬度去划分，为了也是混合数据，提高机器的负荷率。

2 hash取模（Hash分库分表是最普遍的方案）

思考2：为什么不直接取模？而是要先Hash呢？

回答2：因为有时候你用来分库分表的字段不一定是整数类型，所以先Hash可以提高规则的适配度，总之，统一规则即可。

在这里插入图片描述
例子：
⽤户ID是整数型的，要分2库，每个库表数量4张表，⼀共8张表，⽤户ID取模后，值是0到7的要平均分配到每张表

一般规则：
库ID = userId % 库数量 2

表ID = userId / 库数量 2 % 表数量 4

PS：如果你发现某些表的数据量不够，说明你的规则发生了问题，在建表后应该先数据量的测试判断自己的策略无误再使用。

在这里插入图片描述
优点：

保证数据较均匀的分散落在不同的库、表中，可以有效的避免热点数据集中问题

缺点：

扩容不是很⽅便，需要数据迁移

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
数据优化——分库分表（二）策略讲解

分库分表
复制链接

扫一扫

专栏目录

CabbageDevil CSDN认证博客专家 CSDN认证企业博客

码龄6年

40: 原创

10万+: 周排名

42万+: 总排名

5万+: 访问

: 等级

714: 积分

11: 粉丝

21: 获赞

8: 评论

108: 收藏

私信

关注

热门文章

分类专栏

java 23篇
算法 2篇
架构 10篇
MQ消息队列 3篇
docker 6篇
服务器搭建 9篇
Spring 9篇
分库分表 3篇
redis 2篇
多线程 6篇
数据库 5篇

最新评论

java编写redis+lua脚本分布式锁
一条小檀檀: 报错java.lang.Long cannot be cast to java.lang.String
实现JAVA模拟From表单提交
cao9103: header呢？？？
数据优化——分库分表（三）中间件讲解
CabbageDevil: 配置中心的作用是将shardingjdbc的配置统一化管理，可以起到修改配置自动分发到对应机器做动态修改，它的功能就是管理shardingjdbc分库分表的配置
数据优化——分库分表（三）中间件讲解
liusuQAQ: 大佬好，小白想问一下sharding生态里每个图的registy center的作用是什么，谢谢
easyExcel结合Springboot 实战整合
xunkoo: SimpleDateFormat 不是线程安全的

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。