作为一个后端开发人员,我们一般都听说过对数据表进行分区的操作。甚至有开发人员说:这张表以后的数据量一定会很大,至少有好几千万条,我们对这张表分区吧。
然而,有时候并没有感受到查询速度的提升,反而感觉更加的慢了。原因就是不好的分区设计导致对磁盘的IO操作次数增加了。
我们现在来做个测试,数据有1000W条,储存引擎用的是InnoDB。
首先我们创建数据表:1
2
3
4
5
6
7
8create table user (
id int(11) not null auto_increment,
key_id int(11) not null,
primary key (id),
key key_id (key_id)
) engine = innodb
partition by hash (id)
partitions 10;
我们采取的分区类型是hash分区,因为这样可以让数据比较均匀的储存在不同的分区中(我们之后可以看看数据分布情况)。且以主键id为标准进行分区。
partitions 10指的是对这张表分10个区。
好的,创建完数据表之后,我们插入1000W条数据。我们采用存储过程来实现:1
2
3