数据分片
1.垂直分表
分表需求
-
用于划分表,使数据的耦合性降低,容易拓展
-
微服务
分析
- 垂直分库有利于降低数据耦合度(物理服务器,系统业务逻辑),系统间逻辑容易扩展
- 数据整合起来更有条理
- 降低数据库承担的压力,若数据库有性能瓶颈,可根据对应数据库横向扩展
- 垂直分表,将降低mysql查询的IO的性能。(MySQL的innodb引擎使用聚簇索引,当有大字段查询时会损耗IO,聚簇索引可以理解为主键与数据是保存在同一个地方)
- 缺陷:join union 不能使用,不同库的数据只能通过代码组装
- 缺陷:性能问题,复杂的业务逻辑有比较长的调用链
2.水平分表
分表需求
- 表数据增长迅速,数据量在单一表内遇到查询的性能瓶颈。
- 例:订单库分库
水平拆分原则
拆分原则主要是体现分治的思想:把数据根据某个特性划分,把整体数据压力分开
- 根据id求模,拆分数据
- 根据业务字段求模,拆分数据(例如,类型,地区,属性等等)
- 根据用户特殊信息取模,拆分数据(例如,所在地区,年龄段等等)
- 根据时间区间,拆分数据
- 或者根据多个字段,更复杂的逻辑
分析
- 解决单库或者单表,高并发和数据量巨大情况下的性能问题
- 数据库可以按照需求局部横向扩展,如在某个分片的查询比较缓慢,可以相应提高服务器资源
- 提高系统稳定性,体现在压力负载均衡,某个数据库宕机不影响整个系统的允许
- 挑战:数据一致性与操作原子性问题
- 挑战:表拆分逻辑比较难,需要找到适合业务的方案
- 挑战:数据维护与迁移变得更麻烦
场景
场景1: 某网站的浏览记录,浏览记录包含文章,视频,音频等等各个维度,以下统称为素材。假设当起素材浏览量为100w,当在对某个素材进行浏览记录统计时,查询数据遇到瓶颈。
方案:
1.给素材类型字段添加索引。
2.根据年或月,生成统计表,修改一下统计逻辑。
3.根据素材类型水平切分数据表。
场景2:抢票软件的库存表访问数据过大。
方案:
1.根据地区把库存匀到不同地区的数据库集群里;该方案会有某个地区的票比较快买完的情况,需要有个负载均衡服务器,对库存做动态分配。