分库分表
what?
解决由于数据量过大而导致的数据库性能降低的问题,将原来的数据库拆分为若干数据库组成,将数据大表拆分为若干数据表组成,使得单一数据库,单一数据表的数据量变小,从而达到提升数据库性能的目的。
分库分表包括分库和分表两个部分,在生产中通常包括:垂直分库、水平分库、垂直分表、水平分表四种方式。
垂直分表-将一个表按照字段分成多表,每个表存储其中一部分字段
当表数据量很大时,可以将表按字段切开,将热门字段、冷门字段分开放置在不同库中,这些库可以放在不同的存储设备上,避免IO争抢。垂直切分带来的性能提升主要集中在热门数据的操作效率上,而且磁盘争用情况减少。
提升:充分发挥热门数据操作效率,商品信息的操作的高效率不会被商品描述的低效率所拖累
通常我们按照以下规则进行垂直拆分:
1.把不常用的字段单独放在一张表;
2.把text,blob等大字段拆分出来放在附表中;
3.经常组合查询的列放在一张表中
垂直分库-按照业务将表进行分类,分布到不同的数据库上,每个库可以放在不同的服务器上(专库专用)
提升:
1.解决业务层面的耦合,业务清晰
2.能对不同业务的数据进行分级管理,维护,监控,扩展等
3.高并发情况下,垂直分库一定程度的提升IO,数据库连接数,降低单机硬件资源的瓶颈
垂直分库通过将表按业务分类,然后分布在不同数据库,并且可以将这些数据部署在不同服务器上,从而达到多个服务器共同分担压力的效果,但是依然没有解决单表数据量过大的问题
水平分库-把同一个表的数据按一定规则拆到不同的数据库中,每个库可以放在不同的服务器上
如:将店铺ID为单数的和店铺ID为双数的商品信息分别放在两个库中。
也就是说,要操作某条数据,先分析这条数据所属的店铺ID。如果店铺ID为双数,将此操作映射至RRODUCT_DB1(商品库1);如果店铺ID为单数,将操作映射至RRODUCT_DB2(商品库2)。此操作要访问数据库名称的表达式为RRODUCT_DB[店铺ID%2 + 1] 。
提升:
1.解决了单库大数据,高并发的性能瓶颈。
2.提高了系统的可用性(某个库出问题,部分可用)及稳定性(IO冲突减少)
水平分表-在同一个数据库内,把同一个表的数据按一定规则拆到多个表中。
提升:
1.优化单一表数据量过大而产生的性能问题
2.避免IO争抢减少缩表几率
总结
1.垂直分表:可以把一个宽表的字段按照访问频次,是否大字段(text,blob)的原则拆分为多个表,这样能使业务清晰,还能提升部分性能。拆分后,尽量从业务角度避免联查,否则适得其反
2.垂直分库:可以把多个表按业务耦合松紧归类,分别存放在不同库,这些库可以分布在不同服务器,从而使访问压力被多服务器负载,大大提升性能,同时能提高整体架构的业务清晰度,不同的业务库可根据自身情况定制优化方案。但是 它需要解决跨库带来的复杂问题。
3.水平分库:把一个表的数据(按数据行)分到多个不同的库,每个库只有这个数据表的部分数据,这些库可以分布在不同的服务器,从而使访问压力被多服务器负载,大大提升性能。它不仅需要解决跨库带来的复杂性问题,还需要解决数据路由的问题。
4.水平分表:可以把一个表的数据(按数据行)分到多个同一数据库的多张表中,每个表只有这个表的部分数据,这样能小幅提升性能,他仅仅作为水平分库的一个补充优化。
一般来说,在系统设计阶段就应该根据业务耦合松紧来确定垂直分库,垂直分表方案,在数据量及访问压力不是特别大的情况下,首先考虑缓存,读写分离,索引技术等方案。若数据量极大,且持续增长,在考虑水平分库分表方案
参考:https://blog.csdn.net/weixin_44062339/article/details/100491744