SQL优化，一次性插入百万条数据

袅沫

已于 2024-04-17 20:14:22 修改

阅读量503

点赞数 9

分类专栏： MySQL 文章标签： sql 数据库 java

于 2024-04-17 20:08:53 首次发布

本文链接：https://blog.csdn.net/qq_58341172/article/details/137886550

版权

MySQL 专栏收录该内容

32 篇文章 0 订阅

订阅专栏

知识点：

使用有序的id进行插入数据操作；
关闭唯一校验；
关闭自动提交事务

首先创建表结构：

CREATE TABLE `tb_user` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `username` varchar(45) NOT NULL,
  `password` varchar(96) NOT NULL,
  `name` varchar(45) NOT NULL,
  `birthday` datetime DEFAULT NULL,
  `sex` char(1) DEFAULT NULL,
  `email` varchar(45) DEFAULT NULL,
  `phone` varchar(45) DEFAULT NULL,
  `qq` varchar(32) DEFAULT NULL,
  `status` varchar(32) NOT NULL COMMENT '用户状态',
  `create_time` datetime NOT NULL,
  `update_time` datetime DEFAULT NULL,
  PRIMARY KEY (`id`),
  UNIQUE KEY `unique_user_username` (`username`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 ;

准备好需要插入的数据(sql01.log)：

sql01.log排序后的数据：

sql02.log未排序的数据：

对于 InnoDB 类型的表，有以下几种方式可以提高导入的效率：

1）主键顺序插入

因为InnoDB类型的表是按照主键的顺序保存的，所以将导入的数据按照主键的顺序排列，可以有效的提高导入数据的效率。如果InnoDB表没有主键，那么系统会自动默认创建一个内部列作为主键，所以如果可以给表创建一个主键，将可以利用这点，来提高导入数据的效率。

现在进行插入数据：

 load data local infile 'd:/sql01.log' into table tb_user fields terminated by ',' lines terminated by '\n';

这种插入数据的方法，只能在dos窗口操作！！！

执行结果：（7.90s）

数据条数：

删除数据，进行插入第二个文件：

使用降低高水位的方式，删除数据更快！

truncate table tb_user;

执行命令，插入第二个无序文件： (18.83s)

 load data local infile 'd:/sql02.log' into table tb_user fields terminated by ',' lines terminated by '\n';

由于是随机id,存在重复的id,因此不足1000000条数据，但是也能看出效果！！！

2）关闭唯一性校验

在导入数据前执行 SET UNIQUE_CHECKS=0，关闭唯一性校验，在导入结束后执行SET UNIQUE_CHECKS=1，恢复唯一性校验，可以提高导入的效率。

3）手动提交事务

如果应用使用自动提交的方式，建议在导入前执行 SET AUTOCOMMIT=0，关闭自动提交，导入结束后再执行 SET AUTOCOMMIT=1，打开自动提交，也可以提高导入的效率。

但是，我在做实验的时候，没有得到预期的结果：

额外优化方案：

insert into tb_test values(1,'Tom');
insert into tb_test values(2,'Cat');
insert into tb_test values(3,'Jerry');

优化后：

insert into tb_test values(1,'Tom'),(2,'Cat')，(3,'Jerry');

在事务中进行数据插入:

start transaction;
insert into tb_test values(1,'Tom');
insert into tb_test values(2,'Cat');
insert into tb_test values(3,'Jerry');
commit;

数据有序插入：

insert into tb_test values(1,'Tom');
insert into tb_test values(2,'Cat');
insert into tb_test values(3,'Jerry');
insert into tb_test values(4,'Tim');
insert into tb_test values(5,'Rose');

袅沫

关注

9
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
SQL优化，一次性插入百万条数据

因为InnoDB类型的表是按照主键的顺序保存的，所以将导入的数据按照主键的顺序排列，可以有效的提高导入数据的效率。如果应用使用自动提交的方式，建议在导入前执行 SET AUTOCOMMIT=0，关闭自动提交，导入结束后再执行 SET AUTOCOMMIT=1，打开自动提交，也可以提高导入的效率。在导入数据前执行 SET UNIQUE_CHECKS=0，关闭唯一性校验，在导入结束后执行SET UNIQUE_CHECKS=1，恢复唯一性校验，可以提高导入的效率。这种插入数据的方法，只能在dos窗口操作！
复制链接

扫一扫