一. 分区表原理:
分区表由多个相关的底层表实现,这些底层表也是由句柄对象表示,所以我们也可以直接访问各个分区。
二. 分区使用场景:
1)表非常大以至于无法全部放在内存中,或者只在表的最后部分有热点数据,其他均是历史数据。
2)分区表的数据更容易维护。例如:想批量删除大量数据可以使用清除整个分区的方式;还可以对一个独立分区进行优化、检查、修复等操作。
3)分区表的数据可以分布在不同的物理设备上,从而高效的利用多个硬件设备。
4)可以用分区表来避免某些特殊的瓶颈,例如innodb的单个索引的互斥访问、ext3文件系统的inode锁竞争等。
5)可以备份和恢复独立的分区,这在非常大的数据集场景下效果非常好。
三. 分区限制:
1)一个表最多有1024个分区。
2)在mysql5.1中,分区表达式必须是整数,或者是返回整数的表达式。在mysql5.5中,某些场景中可以直接使用列来进行分区。
3)如果分区字段中有主键或者唯一索引的列,那么所有主键和唯一索引列都必须包含进来。
4)分区表中无法使用外键约束。
四. 分区表操作逻辑:
1)select查询:
当查询一个分区表的时候,分区层先打开并锁住所有的底层表,优化器先判断是否可以过滤部分分区,然后再调用对应的存储引擎接口访问各个分区的数据。
2)insert操作:
当写入一条记录时,分区层先打开并锁住所有底层表,然后确定哪个分区接收这条记录,再将记录写入对应底层表。
3)delete操作:
当删除一条记录时,分区层先打开并锁住所有底层表,然后确定数据对应的分区,最后对相应底层表进行删除。
4)update更新:
更新一条记录时,分区层先打开并锁住所有底层表,mysql先确定需要更新的记录在哪个分区,然后取出数据并更新,再判断更新后的数据应该放在哪个分区,最后对底层表进行写入操作,并对原数据所在的底层表进行删除操作。