浅谈分库分表

最新推荐文章于 2024-08-24 20:55:43 发布

修巴利耶

最新推荐文章于 2024-08-24 20:55:43 发布

阅读量379

点赞数

分类专栏： # ShardingSphere 文章标签：分库分表

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xl890727/article/details/97674239

版权

ShardingSphere 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

一、分库分表背景

老调常谈，直接原因是数据量的锅。传统IT/业务量较小的企业里也许很难体现出，而在大型互联网企业里，数据量增长巨快，像我们公司埋点数据的指标拍平后，每天有亿级别的数据。按阿里巴巴给出的开发规范，单表超过500w行就要考虑分表，因为此时单机的性能已经到瓶颈。

所以，后来牛人们提出分布式。一台机器顶不上，那就多台，人多自然力量大，化整为零来解决。

具体到数据的存储上，那就是按照一定的规则，将数据库划分到不同的库/表中，而后取数的时候去特定的存储位置上进行获取。

二、引入分库分表时机¹

我们在编码过程中，分库分表可以在以下几个层次切入：
分库分表切入时机

代码层

完全需要开发人员来编写分库分表的逻辑

框架层

开发人员扩展框架来实现分库分表

驱动层

由第三方实现驱动层的包，供开发人员调用。如Sharding-JDBC、TDDL等。

代理层

由第三方实现，启动服务伪装成数据库，接受业务端的连接。如MyCAT、Sharding-Proxy等。

实现层

底层存储数据的软件变更，如采用TiDB

三、分库分表实现

目前来说，无论从驱动层还是代理层的层面切入，第三方的实现流程大体都要经过如下几步：
分库分表实现

SQL解析

可以使用开源的SQL解析器，如阿里的Druid，或者采用ANTLR创建自己的SQL编译器

SQL路由

SQL路由的意思是指根据传递的数据，经过特定规则能传递到正确的库/表来操作数据。如订单库中，根据用户id分库，然后依据订单id分表，来插入/更新订单信息。

在这个过程中，主要是规则的制定，特别是需要注意数据分库/表后的数据平均。常见的规则譬如取模、哈希和直接指定库/表（尾数为1落1库，尾数为2落2库，尾数为3落3库）等。

SQL改写

经过SQL路由后，分库分表应用模块已经知道某条SQL语句对应的库及表，此时需要改写SQL语句的库/表让其执行在正确的库/表中。如：

SELECT id, order_id, user_id from demo_ds.t_order

可能会改写为:

SELECT id, order_id, user_id from demo_ds_0.t_order_0

SQL执行
结果归并

对于聚合类的查询，当从每个库/表中获取出聚合的结果，比如MAX，分库分表模块还需要归纳，最终取出各个库/表中的最大值进行综合比较返回。

Sharding-JDBC系列之Springboot2中使用Shariding-JDBC分库分表 ↩︎

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。