MySQL-如何分库分表?一看就懂

随着业务发展,数据库压力增大,分库分表成为解决之道。垂直拆分按照业务或字段拆分数据库和表,结构各异,利于业务划分;水平拆分则依据特定规则如hash、range均衡数据,提升性能。但分库分表带来分布式事务、跨库查询等挑战,需权衡选型。常见开源框架如ShardingSphere、Mycat提供了解决方案。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、为什么要分库分表

如果一个网站业务快速发展,那这个网站流量也会增加,数据的压力也会随之而来,比如电商系统来说双十一大促对订单数据压力很大,Tps十几万并发量,如果传统的架构(一主多从),主库容量肯定无法满足这么高的Tps,业务越来越大,单表数据超出了数据库支持的容量,持久化磁盘IO,传统的数据库性能瓶颈,产品经理业务·必须做,改变程序,数据库刀子切分优化。数据库连接数不够需要分库,表的数据量大,优化后查询性能还是很低,需要分。

二、什么是分库分表

分库分表方案是对关系型数据库数据存储和访问机制的一种补充。
分库:将一个库的数据拆分到多个相同的库中,访问的时候访问一个库
分表:把一个表的数据放到多个表中,操作对应的某个表就行

三、分库分表的几种方式

1

1.垂直拆分

(1) 数据库垂直拆分
2根据业务拆分,如图,电商系统,拆分成订单库,会员库,商品库

(2)表垂直拆分
3
根据业务去拆分表,如图,把user表拆分成user_base表和user_info表,use_base负责存储登录,user_info负责存储基本用户信息

垂直拆分特点
1.每个库(表)的结构都不一样
2.每个库(表)的数据至少一列一样
3.每个库(表)的并集是全量数据

垂直拆分优缺点

优点:
1.拆分后业务清晰(专库专用按业务拆分)
2.数据维护简单,按业务不同,业务放到不同机器上

缺点:
1.如果单表的数据量,写读压力大
2.受某种业务决定,或者被限制,也就是说一个业务往往会影响到数据库的瓶颈(性能问题,如双十一抢购)
3.部分业务无法关联join,只能通过java程序接口去调用,提高了开发复杂度

2. 水平拆分

(1) 数据库水平拆分
4
如图,按会员库拆分,拆分成会员1库,会员2库,以userId拆分,userId尾号0-5为1库
6-9为2库,还有其他方式,进行取模,偶数放到1库,奇数放到2库

(2) 表水平拆分
5
如图把users表拆分成users1表和users2表,以userId拆分,进行取模,偶数放到users1表,奇数放到users2表

水平拆分的其他方式

  1. range来分,每个库一段连续的数据,这个一般是按比如时间范围来的,但是这种一般较少用,因为很容易产生热点问题,大量的流量都打在最新的数据上了,优点:扩容的时候,就很容易,因为你只要预备好,给每个月都准备一个库就可以了,到了一个新的月份的时候,自然而然,就会写新的库了 缺点:大部分的 请求,都是访问最新的数据。实际生产用range,要看场景,你的用户不是仅仅访问最新的数据,而是均匀的访问现在的数据以及历史的数据
  2. hash分发,优点:可以平均分配每个库的数据量和请求压力 缺点:扩容起来比较麻烦,会有一个数据迁移的这么一个过程

水平拆分特点
1.每个库(表)的结构都一样
2.每个库(表)的数据都不一样
3.每个库(表)的并集是全量数据

水平拆分优缺点

优点:
1.单库/单表的数据保持在一定量(减少),有助于性能提高
2.提高了系统的稳定性和负载能力
3.拆分表的结构相同,程序改造较少。

缺点:
1.数据的扩容很有难度维护量大
2.拆分规则很难抽象出来
3.分片事务的一致性问题部分业务无法关联join,只能通过java程序接口去调用

四、分库分表带来的问题

  1. 分布式事务
  2. 跨库join查询
  3. 分布式全局唯一id
  4. 开发成本 对程序员要求高

五、分库分表技术如何选型

分库分表的开源框架
jdbc 直连层:shardingsphere、tddl
proxy 代理层:mycat,mysql-proxy(360)

jdbc直连层
6
jdbc直连层又叫jdbc应用层,是因为所有分片规则,所有分片逻辑,包括处理分布式事务
所有这些问题它都是在应用层,所有项目都是由war包构成的,所有分片都写成了jar包,放到了war包里面,java需要虚拟机去运行的,虚拟机运行的时候就会把war包里面的字节文件进行classLoder加载到jvm内存中,所有分片逻辑都是基于内存方进行操作的

proxy代理层
7
如图,proxy代理层,所有分片规则,所有分片逻辑,包括处理分布式事务都在mycat写好了,所有分片逻辑都是基于mycat方进行操作

jdbc直连层和proxy代理层优缺点

  • jdbc直连层性能高,只支持java语言,支持跨数据库
  • proxy代理层开发成本低,支持跨语言,不支持跨数据库
### MySQL 分表策略与实现方法 #### 、分表的概念及其重要性 当单个表的数据量过大时,查询性能可能会显著下降。为了提升数据库的读写效率并优化资源利用,可以采用分表技术。分表的核心在于将张大表拆分为多个较小的子表,从而减少每次操作涉及的数据规模[^1]。 #### 二、分表的主要方式 分表通常可分为两种主要形式:**垂直分表**和**水平分表**。 - **垂直分表** 垂直分表是指按列划分数据结构,即将同张表中的某些字段分离出来形成新的表。这种方法适用于部分字段访问频率较低的情况。例如,假设有张用户表 `users`,其中包含用户的个人信息以及些不常用的日志记录字段,可以通过创建个新的表存储这些低频使用的字段来降低原表复杂度[^4]。 - **水平分表** 水平分表则是基于行进行分割,通常是依据某个特定条件(如时间戳、ID范围等),将满足该条件的部分数据存入不同的子表中。这种方式适合于那些随着时间增长不断积累新数据的大表。 ```sql -- 示例:水平分表按照日期分区 CREATE TABLE orders_2023 ( id INT PRIMARY KEY, order_date DATE NOT NULL, amount DECIMAL(10, 2) ); CREATE TABLE orders_2024 LIKE orders_2023; ``` #### 三、分表的具体实现方法 以下是几种常见的分表实现方案: 1. **手动分表** 手动分表是最简单的方式之,开发者可以根据实际需求自行设计如何分配数据至各个子表。然而,这种做法增加了维护成本,并可能导致逻辑错误的发生概率增加。 2. **使用中间件工具** 随着技术的发展,许多优秀的开源项目提供了自动化的分库分表示能。比如 MyCat 和 ShardingSphere 就是非常流行的两个选项。它们能够帮助企业快速搭建分布式架构环境下的高效解决方案[^3]。 - **MyCat**: 支持灵活配置路由规则,允许自定义 SQL 解析器等功能; - **ShardingSphere**: 提供更丰富的特性集,包括但不限于透明化客户端接入层、动态扩展能力支持等等。 3. **依赖框架完成** 对于应用程序而言,也可以借助 ORM (Object Relational Mapping) 框架内置的支持机制来进行无缝切换。像 Hibernate 或者 Django 的模型迁移功能都可以很好地配合后台服务端起工作[^2]。 #### 四、注意事项及潜在挑战 尽管分表带来了诸多好处,但也伴随着定风险或局限之处需要注意规避: - 数据致性难以保障; - 跨表联结变得困难重重; - 备份恢复过程更加繁琐耗时; 因此,在决定实施之前务必权衡利弊得失后再行动[^3]。 --- ###
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

请叫我黄同学

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值