mysql 分区分表分库分表

风和日丽随波逐流

已于 2022-07-06 18:17:22 修改

阅读量805

点赞数 2

分类专栏：数据库 mysql 文章标签： mysql java 数据库

于 2022-07-06 18:15:18 首次发布

本文链接：https://blog.csdn.net/nimqbiyq/article/details/125636559

版权

数据库同时被 2 个专栏收录

5 篇文章 0 订阅

订阅专栏

mysql

1 篇文章 0 订阅

订阅专栏

分区

把一张表的数据分成N多个区块，这些区块可以在同一个磁盘上，也可以在不同的磁盘上

mysql数据库中的数据是以文件的形势存在磁盘上的，默认放在/mysql/data下面（可以通过my.ini中的datadir来查看），

一张表主要对应着两个个文件（innodb引擎为例），一个是frm存放表结构的，一个是ibd数据和索引文件。如果一张表的数据量太大的话，那么myd,ibd就会变的很大，查找数据就会变的很慢，这个时候我们可以利用mysql的分区功能，在物理上将这一张表对应的三个文件，分割成许多个小块，这样呢，我们查找一条数据时，就不用全部查找了，只要知道这条数据在哪一块，然后在那一块找就行了。如果表的数据太大，可能一个磁盘放不下，这个时候，我们可以把数据分配到不同的磁盘里面去。

MyISAM有三个文件frm(存储表定义)，MYD(MYData，存储数据)，MYI(MYIndex，存储索引)

表分区，是指根据一定规则，将数据库中的一张表分解成多个更小的，容易管理的部分。从逻辑上看，只有一张表，但是底层却是由多个物理分区组成。

子分区

子分区只能在range和list分区下添加的子分区。子分区只有Hash，Key，linear Hash和linear Key

ALTER TABLE `logs`
PARTITION BY RANGE (id)

SUBPARTITION BY HASH (id)
SUBPARTITIONS 2(

PARTITION p0 VALUES LESS THAN (3) ,
PARTITION p1 VALUES LESS THAN (6) ,
PARTITION p3 VALUES LESS THAN MAXVALUE

)

注意事项

分区的列必须包含主键列和唯一索引列

ERROR 1503: A PRIMARY KEY must include all columns in the table's partitioning function
SQL Statement:

ERROR 1503: A UNIQUE INDEX must include all columns in the table's partitioning function
SQL Statement:

分表

将一个表分成n个表

注意事项（通过merge存储引擎来实现分表）

所有表（分表和主表）的列，列名，列类型，列长度必须一致

所有表存储引擎必须都是myisam

字符集，主表必须是分表的超集

主表有的索引分表必须有，索引名称可以不一样，主表没有的索引，分表可以有

分表改名，主表失效需要删除重新创建，主表改名，不影响。

分区和分表的区别和各自优缺点

提高性能上

分表后，单表的并发能力提高了，因为查询一次花费的时间变短了，如果出现高并发的话，总表可以根据不能的查询，将并发分到不同的小表里面。磁盘I/O性能也提高了，因为一个大的数据分成了好几个小的。
分区后，将一个表分成多个区，能提高mysql的性高，单表的数据量达到一定之后，分区将显的很无力这时候就需要分表来解决。

所以开发前期确定一个表的数据数据量可以1个表承受，分区好一点（例如历史数据会定期删除，现有数据量上不会达到数据库存储量瓶颈。）。如果不能那就是分表

实现的难易度上

分表的方法有很多，用merge来分表，是最简单的一种方式。这种方式根分区难易度差不多，并且对程序代码来说可以做到透明的。如果是用其他分表方式就比分区麻烦了。
分区实现是比较简单的，建立分区表，根建平常的表没什么区别，并且对开代码端来说是透明的。

mysql分表和分区有什么联系呢

都能提高mysql的性高，在高并发状态下都有一个良好的表面
分表和分区不矛盾，可以相互配合的，对于那些大访问量，并且表数据比较多的表，我们可以采取分表和分区结合的方式（如果merge这种分表方式，不能和分区配合的话，可以用其他的分表试），访问量不大，但是表数据很多的表，我们可以采取分区的方式等。

分库分表存在的问题

事务问题

在执行分库分表之后，由于数据存储到了不同的库上，数据库事务管理出现了困难。如果依赖数据库本身的分布式事务管理功能去执行事务，将付出高昂的性能代价；如果由应用程序去协助控制，形成程序逻辑上的事务，又会造成编程方面的负担。

跨库跨表的join问题

在执行了分库分表之后，难以避免会将原本逻辑关联性很强的数据划分到不同的表、不同的库上，这时，表的关联操作将受到限制，我们无法join位于不同分库的表，也无法join分表粒度不同的表，结果原本一次查询能够完成的业务，可能需要多次查询才能完成。

额外的数据管理负担和数据运算压力

额外的数据管理负担，最显而易见的就是数据的定位问题和数据的增删改查的重复执行问题，这些都可以通过应用程序解决，但必然引起额外的逻辑运算，例如，对于一个记录用户成绩的用户数据表userTable，业务要求查出成绩最好的100位，在进行分表之前，只需一个order by语句就可以搞定，但是在进行分表之后，将需要n个order by语句，分别查出每一个分表的前100名用户数据，然后再对这些数据进行合并计算，才能得出结果。

风和日丽随波逐流

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
mysql 分区分表分库分表

把一张表的数据分成N多个区块，这些区块可以在同一个磁盘上，也可以在不同的磁盘上mysql数据库中的数据是以文件的形势存在磁盘上的，默认放在/mysql/data下面（可以通过my.ini中的datadir来查看），一张表主要对应着两个个文件（innodb引擎为例），一个是frm存放表结构的，一个是ibd数据和索引文件。如果一张表的数据量太大的话，那么myd,ibd就会变的很大，查找数据就会变的很慢，这个时候我们可以利用mysql的分区功能，在物理上将这一张表对应的三个文件，分割成许多个小块，这样呢，我们查找
复制链接

扫一扫