测试环境:MySQL 5.7
创建测试表:
mysql> create table test1
-> (id bigint auto_increment,
-> aaa varchar(40),
-> PRIMARY key(id)
-> );
Query OK, 0 rows affected (0.01 sec)
mysql> create table test2
-> (id varchar(40),
-> aaa varchar(40),
-> PRIMARY key(id)
-> );
Query OK, 0 rows affected (0.01 sec)
找了个源表,一千多万的数据
mysql> select count(*) from test01;
+----------+
| count(*) |
+----------+
| 11888222 |
+----------+
1 row in set (2.34 sec)
mysql> select * from test01 limit 10;
+-----------------+-----------------+
| id | aaa |
+-----------------+-----------------+
| 150213115534159 | 150213115534159 |
| 150213115537467 | 150213115537467 |
| 150213115559466 | 150213115559466 |
| 150213115611916 | 150213115611916 |
| 150213115612852 | 150213115612852 |
| 150213115622783 | 150213115622783 |
| 150213115632760 | 150213115632760 |
| 150213115640633 | 150213115640633 |
| 150213115738657 | 150213115738657 |
| 150213115742291 | 150213115742291 |
+-----------------+-----------------+
10 rows in set (0.00 sec)
分别将数据插入到test1表和test2表,test1表的id值靠auto_increment自动生成,test2表的id为源表的id(随机字符串)
mysql> insert into test1(aaa) select aaa from test01;
Query OK, 11888222 rows affected (54.43 sec)
mysql> insert into test2 select * from test01;
Query OK, 11888222 rows affected (1 min 43.67 sec)
可以看到随机字符串做主键的话,耗时比自增主键慢得多。
1、如果表使用自增主键,那么每次插入新的记录,记录就会顺序添加到当前索引节点的后续位置,当一页写满,就会自动开辟一个新的页
2、如果使用非自增主键(如果身份证号或学号等),由于每次插入主键的值近似于随机,因此每次新纪录都要被插到现有索引页得中间某个位置,此时MySQL不得不为了将新记录插到合适位置而移动数据,甚至目标页面可能已经被回写到磁盘上而从缓存中清掉,此时又要从磁盘上读回来,这增加了很多开销,同时频繁的移动、分页操作造成了大量的碎片,得到了不够紧凑的索引结构,后续不得不通过OPTIMIZE TABLE来重建表并优化填充页面。