阿里二面：为什么要分库分表？

最新推荐文章于 2023-08-21 11:57:39 发布

IT技术精选文摘

最新推荐文章于 2023-08-21 11:57:39 发布

阅读量133

点赞数

文章标签：数据库算法 java mysql python

原文链接：https://mp.weixin.qq.com/s?__biz=MzU1MjEyNjc0OQ==&mid=2247489915&idx=1&sn=b6eab0ac4c33dc29f30737869321847b&chksm=fb878909ccf0001f61f19cbc9820884870ea912c21469d3e031906a1cf47fb88d259341e9849&scene=126&&sessionid=0

版权

若有收获,请记得分享和转发哦

前言

在高并发系统当中，分库分表是必不可少的技术手段之一，同时也是BAT等大厂面试时，经常考的热门考题。

你知道我们为什么要做分库分表吗？

这个问题要从两条线说起：垂直方向 和 水平方向。

1 垂直方向

垂直方向主要针对的是业务，下面聊聊业务的发展跟分库分表有什么关系。

1.1 单库

在系统初期，业务功能相对来说比较简单，系统模块较少。

为了快速满足迭代需求，减少一些不必要的依赖。更重要的是减少系统的复杂度，保证开发速度，我们通常会使用单库来保存数据。

系统初期的数据库架构如下：此时，使用的数据库方案是：一个数据库包含多张业务表。用户读数据请求和写数据请求，都是操作的同一个数据库。

1.2 分表

系统上线之后，随着业务的发展，不断的添加新功能。导致单表中的字段越来越多，开始变得有点不太好维护了。

一个用户表就包含了几十甚至上百个字段，管理起来有点混乱。

这时候该怎么办呢？

答：分表。

将用户表拆分为：用户基本信息表 和 用户扩展表。

用户基本信息表中存的是用户最主要的信息，比如：用户名、密码、别名、手机号、邮箱、年龄、性别等核心数据。

这些信息跟用户息息相关，查询的频次非常高。

而用户扩展表中存的是用户的扩展信息，比如：所属单位、户口所在地、所在城市等等，非核心数据。

这些信息只有在特定的业务场景才需要查询，而绝大数业务场景是不需要的。

所以通过分表把核心数据和非核心数据分开，让表的结构更清晰，职责更单一，更便于维护。

除了按实际业务分表之外，我们还有一个常用的分表原则是：把调用频次高的放在一张表，调用频次低的放在另一张表。

有个非常经典的例子就是：订单表和订单详情表。

1.3 分库

上图中我列的是一主两从，如果master挂了，可以选择从库1或从库2中的一个，升级为新master。假如我们在这里升级从库1为新master，则原来的从库2就变成了新master的的slave了。

调整之后的架构图如下：

图中将用户库拆分成了三个库，每个库都包含了四张用户表。

如果有用户请求过来的时候，先根据用户id路由到其中一个用户库，然后再定位到某张表。

路由的算法挺多的：

根据id取模，比如：id=7，有4张表，则7%4=3，模为3，路由到用户表3。
给id指定一个区间范围，比如：id的值是0-10万，则数据存在用户表0，id的值是10-20万，则数据存在用户表1。
一致性hash算法

这篇文章就不过多介绍了，后面会有文章专门介绍这些路由算法的。

4 总结

上面主要从：垂直和水平，两个方向介绍了我们的系统为什么要分库分表。

说实话垂直方向（即业务方向）更简单。

在水平方向（即数据方向）上，分库和分表的作用，其实是有区别的，不能混为一谈。

分库：是为了解决数据库连接资源不足问题，和磁盘IO的性能瓶颈问题。
分表：是为了解决单表数据量太大，sql语句查询数据时，即使走了索引也非常耗时问题。此外还可以解决消耗cpu资源问题。
分库分表：可以解决数据库连接资源不足、磁盘IO的性能瓶颈、检索数据耗时和消耗cpu资源等问题。

如果在有些业务场景中，用户并发量很大，但是需要保存的数据量很少，这时可以只分库，不分表。

如果在有些业务场景中，用户并发量不大，但是需要保存的数量很多，这时可以只分表，不分库。

如果在有些业务场景中，用户并发量大，并且需要保存的数量也很多时，可以分库分表。

烧脑?放松一下，听下音乐吧

点击下方

IT技术精选文摘

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
阿里二面：为什么要分库分表？

若有收获,请记得分享和转发哦前言在高并发系统当中，分库分表是必不可少的技术手段之一，同时也是BAT等大厂面试时，经常考的热门考题。你知道我们为什么要做分库分表吗？这个问题要从两条线说起：垂...
复制链接

扫一扫

IT技术精选文摘 CSDN认证博客专家 CSDN认证企业博客

码龄7年

15: 原创

-: 周排名

35万+: 总排名

49万+: 访问

: 等级

5454: 积分

409: 粉丝

295: 获赞

63: 评论

791: 收藏

私信

关注

热门文章

最新评论

数据权限就该这么实现（实践篇），yyds！
bigSheller: 数据权限最好的实现方式就是自动sql注入。行级别的权限控制采用动态注入查询条件，列级别的权限控制一种方式是通过动态修改sql如SELECT NULL AS important_data FROM a，将重要的数据保护，若是使用的select *查询无法修改sql来过滤列转而使用结果集过滤的方式。所有的实现代码可以参考github.com
Kafka 的 Topic 为什么要分区？「豌豆射手」告诉你！
qq_42099303: 说的很好
25 张图 | 深入浅出「偏向锁」
胡须棉花糖: 轻量级锁的hashcode 记录在拥有锁线程的线程栈内Lock Record中；重量级锁在文中有答案
动图图解！收到RST，就一定会断开TCP连接吗？
weixin_45155849: 豁然开朗呀，还有个问题想请假一下，如果客户端想和服务器建立连接，并且发送了syn报文，但客户端收到的ack不是自己期望收到的，此时客户端会直接丢掉还是发给服务器一个rst呢？
Redis 实现高并发下的库存扣减（高频面试）
稻草人X22: 同样内容的帖子我已经看到5篇了

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。