分区的底层:
MySQL从5.0版和5.1版开始引入了很多高级特性,分区表是一个独立的逻辑表,底层由多个物理子表组成。实现分区的代码实际就是对一组底层表的句柄对象的封装,意味着索引也是按照分区的字表定义的,而没有全局索引,而Oracle可以更加灵活的定义索引和表进行分区。MySQL在创建表的时候使用PARTITION BY子句定义每个分区存放的数据。在执行查询的时候,优化器会根据分区定义过滤那些没有我们需要数据的分区,这样查询就无须扫描所有的分区,只需要查找包含需要的数据分区就可以了。分区的另一个主要的目的是将数据按照一个较粗的粒度分在不同的表中,这样做就可以将相关的数据存放在一起,删除数据也很方便。
分区适用的情况:
- 表非常大无法全部放在内存中,或者只在表的最后部分有热点数据,其他均是历史数据。
- 分区表的数据更容易维护,想批量删除大量数据可以使用清除整个分区的方式。
- 分区表的数据可以分布在不同的物理设备上,从而高效的利用多个硬件设备。
- 可以使用分区表来避免某些特殊的瓶颈,例如InnoDB的单个索引的互斥访问,ext3文件系统的inode锁竞争。
- 如果需要,还可以备份和恢复独立的分区,这在非常大的数据集的场景下效果非常好。
分区的一些限制:
- 一个表最多只能有1024个分区
- 在MySQL5.1中,分区表达式必须是整数,或者是返回整数的表达式。在MySQL5.5中,某些场景中可以直接使用列来进行分区
- 如果分区字段中有主键或者是唯一的索引的列,那么所有主键列和唯一索引列都必须包含
- 分区表中无法使用外键约束
分区表的原理:
分区表是由多个相关的底层表实现的,这些底层表也是有句柄对象表示,所以我么可以直接访问各个分区。存储引擎管理分区的各个底层表和管理普通表一样的,在查询、插入、删除、更新操作时,分区层都会打开并锁住所有的底层表,接着判断是哪个分区,最后再进行相应的操作。
分区表的类型:
MySQL支持多种分区表,分区表达式可以是列,也可以是列的表达式。
CREATE TABLE sales (
Order _date DATETIME NOT NULL,
)engine=InnoDB PARTITION BY RANGE(YEAR(ORDER_date))(
PARTITION p_2010 VALUES LESS THAN (2010),
PARTITION p_2011 VALUES LESS THAN (2011),
PARTITION p_2012 VALUES LESS THAN (2012),
PARTITION p_catchall VALUES LESS THAN MAXVALUE);
上面这个表将每一年的销售额存放在不同的分区中。PARTITION分区子句中可以使用各种函数,但是要求表达式的值是一个确定的整数并且不能是常数。根据时间间隔进行分区是一种很常见的技术,MySQL还支持键值、哈希和列表进行分区。