⼀、分区和分表简介
分表
就是将⼀张⼤表分成N个⼩表。
分区
将⼀张⼤表的数据分成N个区块,这些区块可以在同⼀个磁盘上,也可以在不同的磁盘上。
⼆、分区和分表的区别
1. 实现⽅式
1.1 分表
MySQL的分表是真正的分表,将⼀张⼤表分成若⼲个⼩表之后,每个⼩表都是完整的⼀张表,都对应三个⽂件(以MyISAM存储引擎为
例):
.MYD⽂件:数据⽂件;
.MYI⽂件:索引⽂件;
.FRM⽂件:表结构⽂件。
如下图所⽰:
上述的分表使⽤MERGE存储引擎(MyISAM存储引擎的分表变种)。alluser是总表,它下⾯有三个分表,user1、user2和user3。这三个⼦表都是独⽴的表,读取数据的时候,我们可以通过总表来取数据。
由上图可知,三个⼦表的.MYD(数据)和.MYI(索引)⽂件并没有存储在数据库指定的数据⽬录(Data Directory)中,⽽是存储在各⾃指定的⽬录中,然后在数据⽬录中创建相应的软链接指向它们。实际上,MySQL⽀持将分表的相关⽂件分散存储在不同的磁盘和分区中,对于拥有多个磁盘的数据库服务器来说,⽆疑能够充分利⽤多个磁盘的I/O性能。
由上图还可知,总表是没有.MYD和.MYI⽂件的,也就是说,总表并不会存储任何数据和索引,这些都存储在各个分表的相关⽂件之中。总
表的.MRG⽂件存储的内容如下图所⽰:
显⽽易见,alluser.MRG⽂件存储的是分表的表名,以及插⼊数据的⽅式。此处,可以把总表理解成⼀个外壳,或者是连接池。关于MyISAM存储引擎的分表机制,请参考:
《使⽤MERGE存储引擎实现MySQL的分表机制》
1.2 分区
将⼀张⼤表分区之后,它还是⼀张表,不会变成多张表,但是它存放数据的区块变多了。如下图所⽰:
由上图可知,分区⽂件的⽂件名格式为:
索引⽂件名称:
表名#P#分区名.MYI
数据⽂件名称:
表名#P#分区名.MYD
⽰例中的big_table表被分为四个分区,分别是part0、part1、part2和part3。这四个分区的.MYD(数据)和.MYI(索引)⽂件也可以分散存储在不同的⽬录、分区或磁盘中,然后在数据库指定的数据⽬录(Data Directory)中创建软链接指向这些⽂件。对于拥有多个磁盘的数据库服务器来说,⽆疑能够充分利⽤多个磁盘的I/O性能。
除了上述四个分区的相应⽂件之外,数据库还会创建⼀个.par⽂件。这个⽂件类似于分表的.MRG⽂件,⽤于存储这张表的分区信息
关于MyISAM存储引擎的分区机制,请参考:
《MySQL分区理解和实践》
2. 数据处理
2.1 分表
分表之后,数据都是存放在分表⾥的,总表只是⼀个外壳,存取数据发⽣在⼀个⼀个的分表⾥⾯。看下⾯的例⼦:
select*fromalluserwhereid='12';
表⾯上看,是对表alluser进⾏操作的,实际并不是的,⽽是对alluser⾥⾯的分表进⾏了操作。
2.2 分区
分区不存在分表的概念,分区只不过把存放数据的⽂件分割成了许多⼩块,分区后的表仍然是⼀张表,数据处理还是由⾃⼰来完成。
3. 性能提升
3.1 分表
分表之后,单表的并发能⼒提⾼了,磁盘I/O性能也提⾼了。并发能⼒为什么会提⾼呢?因为查询⼀次所花的时间变短了,如果出现⾼并发的话,总表可以根据不同的查询,将并发压⼒分散到不同的⼩表⾥⾯。磁盘I/O性能为什么会提⾼呢?因为本来⼀个⾮常⼤的.MYD(数据)⽂件现在也分散到各个⼩表的.MYD(数据)⽂件中去了。
3.2 分区
MySQL提出了分区的概念,就是想要突破磁盘I/O瓶颈,想要提⾼磁盘的读写能⼒,借此提⾼MySQL的性能。在这⼀点上,分区和分表的测重点不同:分表的重点是存取数据时,如何提⾼MySQL的并发能⼒;分区则偏重于如何突破磁盘的读写能⼒,从⽽达到提⾼MySQL性能的⽬的。
4. 实现难度
4.1 分表
分表的⽅法有很多,⽤MERGE存储引擎来分表,是最简单的⼀种⽅式。这种⽅式和分区难易度差不多,并且对应⽤代码来说可以做到透明的。如果是⽤其他分表⽅式就⽐分区⿇烦了。
4.2 分区
分区实现是⽐较简单的,建⽴分区表和建⽴普通的表没有什么区别,并且对于应⽤代码来说是透明的。
三、分区和分表的关系
都能够提⾼MySQL的性能,分表能够改善⾼并发的性能,分区能够充分利⽤磁盘的I/O吞吐率。
分表和分区并不⽭盾,⽽是可以相互配合的。对于那些访问量⽐较⼤,并且数据量⽐较多的表,可以采取分表和分区结合的⽅式(如果MERGE存储引擎的分表⽅式不能和分区配合的话,也可以使⽤其他的分表⽅式)。对于访问量不⼤,但是数据量⽐较多的表,可以只采取分区的⽅式。