高并发系统中，分库分表是什么？什么场景需要实践？

最新推荐文章于 2024-02-18 11:47:10 发布

淡然旋律

最新推荐文章于 2024-02-18 11:47:10 发布

阅读量648

点赞数 1

文章标签： MySQL 索引数据库

本文链接：https://blog.csdn.net/weixin_43443319/article/details/121491552

版权

最近看到一篇不错文章，能简单明了阐述清楚分库分表的原因和场景。这里结合自己的工作经历，记录些自己的理解，相信对大家平时的工作和架构概念有所帮助，后续应该会抽空推出具体分库分表方案的文章。

在大数据量和高并发系统当中，分库分表是必不可少的技术之一，同时也是BAT大厂面试过程中，经常问的问题。相信很多人听说过分库分表，但具体什么场景下是需要实践分库分表的？

这篇文章，我们将从两个方向：垂直方向和水平方向，来聊下这个问题。

1 垂直方向

垂直方向主要看业务，下面聊聊业务的发展跟分库分表的关系。

1.1 单库

在系统初期，业务功能相对来说比较简单，往往只有几个系统模块，我们通常会使用单库。

系统初期的单库架构：在这里插入图片描述

1.2 分表

系统上线之后，随着业务的不断迭代，往往不断地添加新功能。如此导致单表中的字段越来越多，开始变得越来越冗余，不太好维护，管理起来也会出现混乱。这时候我们可以考虑：分表，将用户表拆分为：用户基本信息表和用户扩展表，如下图：在这里插入图片描述

这些信息跟用户息息相关，查询的频次非常高。而用户扩展表中存的是用户的扩展信息，比如：所属单位、所在城市等非核心数据，这些信息只有在特定的业务场景才需要查询，而绝大多数业务场景是不需要的。

所以通过分表把核心数据和非核心数据（扩展数据）分开，让表的结构更清晰，职责更单一，更便于维护。

除了按实际业务分表之外，我们还有一个常用的分表原则是：把调用频次高的放在一张表，调用频次低的放在另一张表，比如：订单表和订单详情表。

1.3 分库

假设系统已经上线有漫长时间（一年多）。经历了N个迭代开发，系统功能完善，意味着系统各种关联关系，错综复杂。

此时，如果不赶快梳理业务逻辑，后面会带来很多隐藏问题，这就需要按业务功能，划分不同领域了。把相同领域的表放到同一个数据库，不同领域的表，放在另外的数据库。拆分过程如下：在这里插入图片描述

将用户、商品、物流、订单等相关的表，从原来一个数据库中，拆分成单独的用户库、商品库、物流库和订单库，一共四个数据库。在这里为了看起来更直观，每个库我只画了一张表，实际场景可能有多张表。

这样按业务拆分之后，每块业务只用关注自己相关的表，职责单一，会变得更好维护。

1.4 分库分表

有时候按业务，只分库或只分表是不够的。比如一些银行或券商的金融系统，可能需要按月份和年份汇总，所有用户的资金和流水情况，这里就需要考虑：分库分表，如下图：在这里插入图片描述

如此设计之后，就能很高效地查询出某个用户每个月或每年的资金流水概况了。

2 水平方向

水分方向主要看数据量，下面聊下数据跟分库分表的关系。

2.1 单库

在系统初期，由于用户非常少，所以系统并发量很小。并且表中的数据量也非常少。这时的数据库架构可能如下：在这里插入图片描述

用户读和写数据请求，都是连接同一个数据库，该方案比较适合于并发量低的业务场景。

2.2 主从读写分离

系统上线运行一段时间后，用户数量也会随着增加。理所当然用户的请求中，读数据的请求会占据大部分，写数据的请求占比相对而言很少。数据库连接是有限的，它是非常宝贵的资源。而每次数据库的读写请求，都需要占用至少一个数据库连接，如果读数据请求把连接占用完了，不就写不了数据了？为解决该问题就需要考虑：读写分离。在这里插入图片描述

如上图，所有的写数据的请求，都指向主库master。一旦主库写完数据之后，立马异步同步给slave从库（例如基于Mysql的binlog同步，这里推荐了解下阿里开源框架canal）。这样所有的读数据请求，就能及时从从库中获取到数据了（除非网络有延迟）。

读写分离方案可以很好的解决上面提到的单节点问题，相比单库的方案，能够更好地保证系统的稳定性。因为如果主库挂了，可以升级从库为主库，将所有读写请求都指向新主库，系统又能恢复正常运行。但这里有个问题就是：如果用户量确实有些大，如果master挂了，升级slave为master，将所有读写请求都指向新master。但此时，如果这个新master根本扛不住所有的读写请求，该怎么办？这就需要一主多从的架构，如下图：在这里插入图片描述

上图中我列的是一主两从，如果master挂了，可以选择从库1或从库2中的一个，升级为新master。假如我们在这里升级从库1为新master，则原来的从库2就变成了新master的的slave了。调整之后的架构图如下：在这里插入图片描述

如此就能解决上面的问题了。除此之外，如果查询请求量再增大，我们还可以将架构升级为一主三从、一主四从…等等。

2.3 分库

上面的读写分离方案确实可以解决读请求量大，但写请求很少时，主库master节点扛不住的问题。但假设某个业务，比如：订单库，若下单的请求非常多，即wirte写请求请求量很大，一个master库可能无法承受住这么大的压力。这时就可以考虑：建立多个订单库。订单库的拆分过程如下：在这里插入图片描述

2.4 分表

客户端请求量上来了，带来的势必是数据量的成本上升。即使做了分库，但有可能是单个库，比如：订单库，出现了3000万的数据。

假设使用的是Mysql数据库，单表的数据量最好不要超过500万行。如果有几千万级的数据量，仍然单表来存，性能会变得很差，而数据量太大了，需要建立的索引也会很大，从小到大检索一次数据，会非常耗时和消耗资源。这时候就需要考虑：分表，这样可以控制每张表的数据量，和索引大小。表的拆分过程如下：在这里插入图片描述