浅析分库和分表

最新推荐文章于 2024-06-12 19:31:55 发布

加班狗的微博

最新推荐文章于 2024-06-12 19:31:55 发布

阅读量105

点赞数

文章标签：数据库分布式程序人生经验分享

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhangdx001/article/details/105821312

版权

为什么要分库分表？

随着业务量不断上涨，数据量和请求量会变的越来越大，凭借单个数据库和单个表扛不住暴增的数据量和请求量。

分表

以mysql为例，一旦数据量达到千万级别，就会极大影响你的 sql的性能，无论是新增还是查询数据都会变的很慢。一般来说，一旦单表数据量到六、七百万的时候，就需要开始考虑分表了。

分表可以以月份为纬度，每月数据分表。也可以以用户纬度分表，对于用户id取模或hash等方式分表，也可以根据地区为纬度分表。

分库

每个数据库的连接数是有限的，最多支撑到并发 2000（最好保持在1000 一下）。可以将一个库的数据拆分到多个库中，分散请求量。

如何分库分表？

Sharding-jdbc

当当开源的，属于 client 层方案，支持分库分表、读写分离、分布式 id 生成（支持snowflake）、柔性事务（最大努力送达型事务、TCC 事务）。不用部署，运维成本低，不需要代理层的二次转发请求，性能很高，但是如果遇到升级啥的需要各个系统都重新升级版本再发布，各个系统都需要耦合 Sharding-jdbc 的依赖。

Mycat

基于 Cobar 改造的，属于 proxy 层方案，支持的功能非常完善，而且目前应该是非常火的而且不断流行的数据库中间件，社区很活跃，也有一些公司开始在用了。不需要部署，自己运维一套中间件，运维成本高，但是对于各个项目是透明的，如果遇到升级之类的都是自己中间件那里搞就行了。

如何迁移数据？

1）停服数据迁移，会影响正常业务，不建议

2）数据双写，上线后同时忘两个库写数据，然后将历史数据导入新库，需要修改线上代码，不建议

3）使用阿里canal同步mysql binlog，写入新库，不影响线上逻辑

加班狗的微博

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
浅析分库和分表

为什么要分库分表？随着业务量不断上涨，数据量和请求量会变的越来越大，凭借单个数据库和单个表扛不住暴增的数据量和请求量。分表以mysql为例，一旦数据量达到千万级别，就会极大影响你的 sql的性能，无论是新增还是查询数据都会变的很慢。一般来说，一旦单表数据量到六、七百万的时候，就需要开始考虑分表了。分表可以以月份为纬度，每月数据分表。也可以以用户纬度分表，对于用户id取模或hash等...
复制链接

扫一扫

加班狗的微博 CSDN认证博客专家 CSDN认证企业博客

码龄13年

266: 原创

6万+: 周排名

140万+: 总排名

15万+: 访问

: 等级

3859: 积分

20: 粉丝

33: 获赞

26: 评论

263: 收藏

私信

关注

热门文章

最新评论

简述Minor GC、Major GC和Full GC之间的区别
minyunfei6: 博主,我看你在majorgc和fullgc触发条件中都提到了老年代空间不够。那老年代空间不够时是会触发majorgc还是fullgc呢？
mq选型：rocketMq和kafka对比
倒吃甘蔗: kafka 无论是scala 还是 java 的版本，不也是用的jvm 消息缓存不也会导致频繁GC 吗
spring boot使用经验分享（一）tomcat参数配置
hennry_9523: 最大线程数决定了Web服务最多可以同时处理多少个请求（默认200），一个线程不是可以处理多个请求吗
Redisson解决redis分布式锁过期业务没执行完问题
就叫basi: 解决不了的
Redisson解决redis分布式锁过期业务没执行完问题
就叫basi: 接口幂等，数据状态机

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。