小生博客:http://xsboke.blog.51cto.com

   

  

 

                             -------谢谢您的参考,如有疑问,欢迎交流


一、 分表

  1. 分表简介

  • 分表是将一个大表按照一定的规则分解成多张具有独立存储空间的实体表。

  • 如果正在使用的表需要进行分区,就需要同时修改app的规则,使mysql可以得知用户查询的数据在哪。

  2. 分表类型

 分为垂直切分和水平切分

  • 垂直切分:将某些列分到另一个表

  • 水平切分:将某些行分到另一个表

  3. 分表的方式

   1) Mysql集群

  • 它并不是分表,但起到了和分表相同的作用。集群可分担数据库的操作次数,将任务分担到多台数据库上。集群可以读写分离,减少读写压力。从而提升数据库性能。

   2) 预先估计会出现大数据量并且访问频繁的表,将其分为若干个表

  • 根据一定的算法(如用hash的方式,也可以用求余(取模)的方式)让用户访问不同的表

   3) 利用merge存储引擎来实现分表

  • 使用merge存储引擎分表,就不用再修改app规则

  • merge分表,分为主表和子表,主表类似于一个壳子,逻辑上封装了子表,实际上数据都是存储在子表中的。


  4. merge存储引擎分表

     wKiom1kqp4SDz-1MAAGRwSl27BA019.jpg

     wKioL1kqp4fDO1xgAAE0f07Czls107.jpg


     创建子表

     wKiom1kqp63gE_DHAAEFvZyPmyE502.jpg

     创建主表

     wKiom1kqp8jDm9G5AAEewD43W30623.jpg

    开始分表

     通过ID取模的方式过滤出分别要插入到子表的数据

     wKioL1kqp_iCfBr_AADH-lySEzs948.jpg

     验证

     wKiom1kqqAPS4bsQAABOugZOwmI017.png

     子表2只有奇数数据,而主表都会有

     每个子表都会有自己独立的表文件

     wKioL1kqqBaCrjRlAACYB4UIk6E775.jpg

二、 分区

  1. 什么是分区

  • 分区和分表相似,都是按照规则分解表。不同在于分表将大表分解为若干个独立的实体表,而分区是将数据分段划分在多个位置存放,分区后,表还是一张表,但数据散列到多个位置了

  2. 分区形式

  • 水平分区(HorizontalPartitioning这种形式分区是对表的行进行分区,所有在表中定义的列在每个数据集中都能找到,所以表的特性依然得以保持。

  • 垂直分区(VerticalPartitioning这种分区方式一般来说是通过对表的垂直划分来减少目标表的宽度,使某些特定的列被划分到特定的分区,每个分区都包含了其中的列所对应的行。

  3. 查看mysql是否支持分区技术

     wKioL1kqqJbzm-VHAAByVyr2M2c156.jpg

     本例是5.7

     wKiom1kqqKvDp-S_AAGspVkccTM494.jpg

     首先创建表并为其创建分区,并插入数据,以作测试

     wKioL1kqqL6imJWkAAGgd4rh-dY783.jpg

     下图是插入的数据

     wKiom1kqqNrSX0w8AABbFN0B4tA511.jpg

     去查看物理文件

     wKioL1kqqOjx8fnUAABluD9gwV4277.jpg

     从information_schema系统库中的partitions表中查看分区信息

     wKiom1kqqP2xm3TBAAGEBfRne7c605.jpg

     从某个分区中查询数据

     wKiom1kqqQrhomFiAABki1G46TU976.jpg

     添加一个分区

     wKioL1kqqRaBa0NLAABO7-fRhtE227.jpg

     合并分区

     wKiom1kqqSfjHF_ZAADCmvMuVJo309.jpg

  4. 对比创建分区和没创建分区的性能

     首先创建一个表tab1不做分区

     wKioL1kqqTmQEBNaAAA9nE66wS0899.jpg

     创建表tab2按日期的年份拆分

     wKioL1kqqUmS0nH2AAFNnyerR2Y448.jpg

     创建一个存储过程,循环向表中存入足够大的数据,用于测试

     wKiom1kqqVmSfxCjAAD3ObE25Wc858.jpg

     执行存储过程

     wKiom1kqqWTRpDatAAAceIIF-e8852.png

     将tab1的数据插入到tab2

     wKioL1kqqW_h5Nw_AABKrMo81xw040.jpg

     执行查询语句测试性能,执行时间短的性能就好

     wKioL1kqqYGBslAQAADY5G5a8J0775.jpg

     通过explain语句分析执行情况

     wKiom1kqqZWyG-jAAAA6xwsNsdQ697.jpg

     未分区的表

     wKiom1kqqZeyV4ZyAACWpHGmMks652.jpg

     已分区的表

     wKioL1kqqZnx6f_9AACHEC5-PM8423.jpg

    为两个表创建索引

     wKiom1kqqdHQy2pyAAByiFVI4dM044.jpg

     再次进行测试

     wKioL1kqqeOSAnxMAAC97HKHU7I287.jpg

三、 Mysql的分区类型

   在创建表的时候使用:partition by  类型(字段),定义分区类型及其使用的字段

  1. Range

l  基于一个连续区间的列值,把多行分配给分区,区间不能重叠

l  使用values  less  than操作符定义分区

l  一般最后要创建一个maxvalue分区,用于存放和之前区间不匹配的值

     wKiom1kqqiGStzfJAAFZ8ufUkiA831.jpg

  2. List分区

l  基于列值匹配一个离散值(不连续的值)集合中的某个值来进行分区

l  使用:Values  in,操作符定义分区

l  List没有range中类似于maxvalue的定义符存在,所以要匹配的值都必须手动创建

 wKioL1kqqpSBPIcsAAE_-FsoHBc991.jpg

  3. Hash分区

l对表的一个或多个列的hashkey进行计算,最后通过这个Hash码不同数值对应的数据区域进行自动分区,但需要指定分区数量。

lListrange必须指定一个给定的列值或列值集合应该保存在哪个分区中,而在HASH分区中,MYSQL自动完成这些工作。

lHash分区的目的是将数据均匀的分布到预先定义的各个分区中

 wKiom1kqqtDS8h-aAAB0ub3vNGg864.jpg

 

  4. Key分区

l与hash相似,不同在于hash分区是用户自定义函数进行分区,而key分区使用mysql数据库提供的函数进行分区,不同的存储引擎,使用的函数可能不同

     wKioL1kqqy6ARDjvAAA5ybLljLU330.jpg

  5. Columns分区

lmysql5.5开始支持,可以视为rangelist分区的进化,columns分区可以直接使用非×××数据进行分区

lCOLUMNS分区支持以下数据类型:

  所有×××,如INTSMALLINT TINYINT BIGINTFLOATDECIMAL则不支持。

  日期类型,如DATEDATETIME。其余日期类型不支持。

  字符串类型,如CHARVARCHARBINARYVARBINARYBLOBTEXT类型不支持。

  COLUMNS可以使用多个列进行分区。

  6. Mysql分区是可以指定存储位置的,通过查看帮助,我们可以得到更多关于创建表的参数

     wKiom1kqrEKjamEyAAFuae0NJhI321.jpg

     wKioL1kqrEOSQCEnAAD3O9015k0468.jpg

例:创建分区表,并且将数据文件存放到其他位置,innodb存储引擎,数据文件和索引文件是在一起的,所以只需要指定数据文件的位置

    wKiom1kqrGyx7nSmAABUrx6G9Kk374.jpg

    wKioL1kqrGyTB8JbAAExyWpAQ-Q235.jpg

  7. 其实hashkey也是根据取余进行分区运算

    比如分成4个分区

    wKiom1kqrHnQsQ2HAADE8jfmJA8517.jpg

四、 Mysql分区与分表的区别

  1. 实现方式

  • 分表是真的将一个表分成多个小表

  • 分区只是将数据分区,而分区后的表还是一张表,数据处理还是由自己完成

  2. 数据处理

  • 分表后,数据都是存放在分表里,总表只是一个外壳,存取数据发生在一个一个的分表里面。

  • 分区,不存在分表的概念,分区只不过把存放数据的文件分成了许多小块,分区后的表呢,还是一张表,数据处理还是由自己来完成。

  3. 提高性能

  • 分表后,单表的并发能力提高了,磁盘I/O性能也提高了,重点是存取数据时,如何提高mysql并发能力。

  • 分区,主要是想突破磁盘I/O瓶颈,想提高磁盘的读写能力,来增加mysql性能。

  4. 实现难易

  • 分表除了用marge存储引擎分表对程序代码是透明的外,其他的大部分都不是

  • 分区实现是比较简单的,建立分区表,根建平常的表没什么区别,并且对开代码端来说是透明的。

五、 分区和分表的联系

  • 都能提高mysql的性高,在高并发状态下都有一个良好的表现

  • 分表和分区不矛盾,可以相互配合的,对于那些大访问量,并且表数据比较多的表,我们可以采取分表和分区结合的方式,访问量不大,但是表数据很多的表,我们可以采取分区的方式等

  • 分表技术是比较麻烦的,需要手动去创建子表,app服务端读写时候需要计算子表名。采用merge好一些,但也要创建子表和配置子表间的union关系。

  • 表分区相对于分表,操作方便,不需要创建子表。