mysql分区和分表⽐较_MySQL分区和分表的区别与联系

最新推荐文章于 2024-08-25 18:45:07 发布

echo程序鱼

最新推荐文章于 2024-08-25 18:45:07 发布

阅读量871

点赞数

分类专栏： mysql 笔记文章标签： mysql 数据库 database

原文链接：https://wenku.baidu.com/view/31dfb64e7d21af45b307e87101f69e314332faee.html

版权

笔记同时被 2 个专栏收录

26 篇文章 0 订阅

订阅专栏

mysql

6 篇文章 1 订阅

订阅专栏

本文详细介绍了MySQL的分表和分区机制，包括两者的实现方式、数据处理、性能提升及实现难度。分表通过创建多个独立的子表提高并发能力和磁盘I/O性能，而分区则是将大表数据划分到多个区块，以优化磁盘读写。两者可以结合使用，以应对高并发和大量数据的场景。

摘要由CSDN通过智能技术生成

⼀、分区和分表简介

分表
就是将⼀张⼤表分成N个⼩表。
分区
将⼀张⼤表的数据分成N个区块，这些区块可以在同⼀个磁盘上，也可以在不同的磁盘上。

⼆、分区和分表的区别

1. 实现⽅式

1.1 分表
MySQL的分表是真正的分表，将⼀张⼤表分成若⼲个⼩表之后，每个⼩表都是完整的⼀张表，都对应三个⽂件(以MyISAM存储引擎为
例)：
.MYD⽂件：数据⽂件；
.MYI⽂件：索引⽂件；
.FRM⽂件：表结构⽂件。
如下图所⽰：

上述的分表使⽤MERGE存储引擎(MyISAM存储引擎的分表变种)。alluser是总表，它下⾯有三个分表，user1、user2和user3。这三个⼦表都是独⽴的表，读取数据的时候，我们可以通过总表来取数据。

由上图可知，三个⼦表的.MYD(数据)和.MYI(索引)⽂件并没有存储在数据库指定的数据⽬录(Data Directory)中，⽽是存储在各⾃指定的⽬录中，然后在数据⽬录中创建相应的软链接指向它们。实际上，MySQL⽀持将分表的相关⽂件分散存储在不同的磁盘和分区中，对于拥有多个磁盘的数据库服务器来说，⽆疑能够充分利⽤多个磁盘的I/O性能。

由上图还可知，总表是没有.MYD和.MYI⽂件的，也就是说，总表并不会存储任何数据和索引，这些都存储在各个分表的相关⽂件之中。总
表的.MRG⽂件存储的内容如下图所⽰：

显⽽易见，alluser.MRG⽂件存储的是分表的表名，以及插⼊数据的⽅式。此处，可以把总表理解成⼀个外壳，或者是连接池。关于MyISAM存储引擎的分表机制，请参考：
《使⽤MERGE存储引擎实现MySQL的分表机制》

1.2 分区
将⼀张⼤表分区之后，它还是⼀张表，不会变成多张表，但是它存放数据的区块变多了。如下图所⽰：

由上图可知，分区⽂件的⽂件名格式为：
索引⽂件名称：
表名#P#分区名.MYI
数据⽂件名称：
表名#P#分区名.MYD
⽰例中的big_table表被分为四个分区，分别是part0、part1、part2和part3。这四个分区的.MYD(数据)和.MYI(索引)⽂件也可以分散存储在不同的⽬录、分区或磁盘中，然后在数据库指定的数据⽬录(Data Directory)中创建软链接指向这些⽂件。对于拥有多个磁盘的数据库服务器来说，⽆疑能够充分利⽤多个磁盘的I/O性能。

除了上述四个分区的相应⽂件之外，数据库还会创建⼀个.par⽂件。这个⽂件类似于分表的.MRG⽂件，⽤于存储这张表的分区信息
关于MyISAM存储引擎的分区机制，请参考：
《MySQL分区理解和实践》

2. 数据处理
2.1 分表
分表之后，数据都是存放在分表⾥的，总表只是⼀个外壳，存取数据发⽣在⼀个⼀个的分表⾥⾯。看下⾯的例⼦：
select*fromalluserwhereid='12';
表⾯上看，是对表alluser进⾏操作的，实际并不是的，⽽是对alluser⾥⾯的分表进⾏了操作。

2.2 分区
分区不存在分表的概念，分区只不过把存放数据的⽂件分割成了许多⼩块，分区后的表仍然是⼀张表，数据处理还是由⾃⼰来完成。

3. 性能提升
3.1 分表
分表之后，单表的并发能⼒提⾼了，磁盘I/O性能也提⾼了。并发能⼒为什么会提⾼呢？因为查询⼀次所花的时间变短了，如果出现⾼并发的话，总表可以根据不同的查询，将并发压⼒分散到不同的⼩表⾥⾯。磁盘I/O性能为什么会提⾼呢？因为本来⼀个⾮常⼤的.MYD(数据)⽂件现在也分散到各个⼩表的.MYD(数据)⽂件中去了。

3.2 分区
MySQL提出了分区的概念，就是想要突破磁盘I/O瓶颈，想要提⾼磁盘的读写能⼒，借此提⾼MySQL的性能。在这⼀点上，分区和分表的测重点不同：分表的重点是存取数据时，如何提⾼MySQL的并发能⼒；分区则偏重于如何突破磁盘的读写能⼒，从⽽达到提⾼MySQL性能的⽬的。

4. 实现难度
4.1 分表
分表的⽅法有很多，⽤MERGE存储引擎来分表，是最简单的⼀种⽅式。这种⽅式和分区难易度差不多，并且对应⽤代码来说可以做到透明的。如果是⽤其他分表⽅式就⽐分区⿇烦了。

4.2 分区
分区实现是⽐较简单的，建⽴分区表和建⽴普通的表没有什么区别，并且对于应⽤代码来说是透明的。

三、分区和分表的关系

都能够提⾼MySQL的性能，分表能够改善⾼并发的性能，分区能够充分利⽤磁盘的I/O吞吐率。
分表和分区并不⽭盾，⽽是可以相互配合的。对于那些访问量⽐较⼤，并且数据量⽐较多的表，可以采取分表和分区结合的⽅式(如果MERGE存储引擎的分表⽅式不能和分区配合的话，也可以使⽤其他的分表⽅式)。对于访问量不⼤，但是数据量⽐较多的表，可以只采取分区的⽅式。