什么是分区?
数据分区是一种物理数据库的设计技术,目的是为了在特定的SQL操作中减少数据读写的总量以缩减响应时间。
分区
是一种物理数据库设计技术,MySQL数据库默认使用水平分:
分区方式
- 水平分区:对表的行进行分区,不同分组的数据放在不同分区种,表的所有列均在每个分区内有,维持原有的表结构,只是把数据分组存放在不同分区 ;
- 垂直分区:将某些列划到指定分区,减少表的宽度,每个分区都保存了其中列所在的行;
分区模式
- Range:按某个或某些列的范围划分,比如年;
- Hash:根据某些列的hash值进行分区划分,比如海量数据的去重聚合;
- Key:也是hash,不过使用系统的hash函数;
- List:自定义某列的属性值范围,落在这些值内的行划到一组;
优点
- 性能提升:海量数据分区,提高检索效率,比如100w数据分成10个分区,如果要找一个数之前知道它在那个分区,那么效率比在100w数据种检索快很多;
- 方便管理:建立好分区之后,数据库负责分区的管理。DBA操作上既减少管理的数据量又保证数据完整性和关联性;
分表
将原有的单数据表拆分为多个数据表,然后把数据按规则存放进不同的数据表中,属于数据库的一种设计方案,需要配合后端代码实现;
分库
数据库一旦分表之后,库内的数据表就会增多,当表量到达一定程度时,此时可以选择分库,将不同的数据表划分到不同的数据库;
分片
通过某种特定的条件,将我们存放在同一数据库中的数据分散存放到多个数据库(主机)中,以达到单台设备负载的效果。
数据的切分(sharding)
根据其切分规则类型分为以下2种模式:
纵向切分
按照不同的表(或Schema)来切分到不同的数据库(主机)种,这种切分可以称为数据的垂直(纵向)切分;
横向切分
按照表中数据的逻辑关系,将同一个表的数据按照某种条件拆分到多台数据库(主机)中,这样切分称为数据的水平(横向)切分;
使用条件
什么时候考虑使用分区
- 一张表的查询速度已经慢到影响使用的时候;
- sql已经优化,且很难再次进行优化;
- 表数据量太大;
- 表中的数据是分段的;
- 对数据的操作往往只涉及一部分数据,而不是所有的数据;
分区解决的问题
- 主要提升数据的查询效率
什么时候考虑分表
- 一张表的查询速度已经慢到影响使用的时候;
- sql已经优化,且很难再次进行优化;
- 表数据量太大;
- 当频繁插入或者联合查询时,速度变慢;
分表解决的问题
分表后,单表的并发能力提高了,磁盘I/O性能也提高了,写操作效率提高了。
- 单次查询数据时间变短;
- 数据分布在不同的文件上,磁盘I/O性能提高;
- 读写锁影响的数据量变小;
- 插入数据库需要重新建立索引的数据减少;