MySQL插入语句insert性能优化



对于一些数据量较大的系统,面临的问题除了是查询效率低下,还有一个很重要的问题就是插入时间长。当导入的数据量较大时,插入操作耗费的时间相当可观。因此,提高大数据量系统的MySQL insert效率是很有必要的。

1. 一条SQL语句插入多条数据。

常用的插入语句如:

  1. INSERT INTO `insert_table` (`datetime`, `uid`, `content`, `type`) VALUES ('0''userid_0''content_0', 0);    
  2. INSERT INTO `insert_table` (`datetime`, `uid`, `content`, `type`) VALUES ('1''userid_1''content_1', 1);  
INSERT INTO `insert_table` (`datetime`, `uid`, `content`, `type`) VALUES ('0', 'userid_0', 'content_0', 0);  
INSERT INTO `insert_table` (`datetime`, `uid`, `content`, `type`) VALUES ('1', 'userid_1', 'content_1', 1);
修改成:

  1. INSERT INTO `insert_table` (`datetime`, `uid`, `content`, `type`) VALUES   
  2.     ('0''userid_0''content_0', 0), ('1''userid_1''content_1', 1);  
INSERT INTO `insert_table` (`datetime`, `uid`, `content`, `type`) VALUES 
    ('0', 'userid_0', 'content_0', 0), ('1', 'userid_1', 'content_1', 1);
Java实现:

  1. Connection connection = DriverManager.getConnection("jdbc:mysql://localhost:3306/test","root","123");  
  2. // 关闭自动提交,默认情况下每执行一条sql提交一次  
  3. connection.setAutoCommit(false);  
  4. PreparedStatement statement = connection.prepareStatement("INSERT INTO insert_table VALUES(?, ?)");   
  5. //记录1  
  6. statement.setString(1"2012-12-27 11:11:11");   
  7. statement.setString(2"userid_0");   
  8. statement.setString(3"content_0");   
  9. statement.setInt(40);   
  10. statement.addBatch();   
  11. //记录2  
  12. statement.setString(1"2012-12-27 12:12:12");   
  13. statement.setString(2"userid_1");   
  14. statement.setString(3"content_1");   
  15. statement.setInt(41);  
  16. statement.addBatch();   
  17. //记录3  
  18. statement.setString(1"2012-12-27 13:13:13");   
  19. statement.setString(2"userid_2");   
  20. statement.setString(3"content_2");   
  21. statement.setInt(42);   
  22.   
  23. statement.addBatch();   
  24. //批量执行上面3条语句.   
  25. int [] counts = statement.executeBatch();   
  26. //Commit   
  27. connection.commit();  
Connection connection = DriverManager.getConnection("jdbc:mysql://localhost:3306/test","root","123");
// 关闭自动提交,默认情况下每执行一条sql提交一次
connection.setAutoCommit(false);
PreparedStatement statement = connection.prepareStatement("INSERT INTO insert_table VALUES(?, ?)"); 
//记录1
statement.setString(1, "2012-12-27 11:11:11"); 
statement.setString(2, "userid_0"); 
statement.setString(3, "content_0"); 
statement.setInt(4, 0); 
statement.addBatch(); 
//记录2
statement.setString(1, "2012-12-27 12:12:12"); 
statement.setString(2, "userid_1"); 
statement.setString(3, "content_1"); 
statement.setInt(4, 1);
statement.addBatch(); 
//记录3
statement.setString(1, "2012-12-27 13:13:13"); 
statement.setString(2, "userid_2"); 
statement.setString(3, "content_2"); 
statement.setInt(4, 2); 

statement.addBatch(); 
//批量执行上面3条语句. 
int [] counts = statement.executeBatch(); 
//Commit 
connection.commit();

修改后的插入操作能够提高程序的插入效率。这里第二种SQL执行效率高的主要原因有两个,一是减少SQL语句解析的操作, 只需要解析一次就能进行数据的插入操作,二是SQL语句较短,可以减少网络传输的IO。

性能:
这里提供一些测试对比数据,分别是进行单条数据的导入与转化成一条SQL语句进行导入,分别测试1百、1千、1万条数据记录。

记录数单条数据插入多条数据插入
1百 0.149s 0.011s
1千1.231s 0.047s
1万11.678s 0.218s

2. 在事务中进行插入处理。

把插入修改成:

  1. START TRANSACTION;    
  2. INSERT INTO `insert_table` (`datetime`, `uid`, `content`, `type`) VALUES ('0''userid_0''content_0', 0);    
  3. INSERT INTO `insert_table` (`datetime`, `uid`, `content`, `type`) VALUES ('1''userid_1''content_1', 1);    
  4. ...    
  5. COMMIT;  
START TRANSACTION;  
INSERT INTO `insert_table` (`datetime`, `uid`, `content`, `type`) VALUES ('0', 'userid_0', 'content_0', 0);  
INSERT INTO `insert_table` (`datetime`, `uid`, `content`, `type`) VALUES ('1', 'userid_1', 'content_1', 1);  
...  
COMMIT;
使用事务可以提高数据的插入效率,这是因为进行一个INSERT操作时,MySQL内部会建立一个事务,在事务内进行真正插入处理。通过使用事务可以减少数据库执行插入语句时多次“创建事务,提交事务”的消耗,所有插入都在执行后才进行提交操作。
性能:
这里也提供了测试对比,分别是不使用事务与使用事务在记录数为1百、1千、1万的情况。

记录数不使用事务使用事务
1百0.149s 0.033s
1千1.231s 0.115s
1万11.678s 1.050s

性能测试:

这里提供了同时使用上面两种方法进行INSERT效率优化的测试。即多条数据合并为同一个SQL,并且在事务中进行插入。

记录数单条数据插入合并数据+事务插入
1万0m15.977s 0m0.309s
10万1m52.204s 0m2.271s
100万18m31.317s 0m23.332s

从测试结果可以看到,insert的效率大概有50倍的提高,这个一个很客观的数字。

注意事项:

1. SQL语句是有长度限制,在进行数据合并在同一SQL中务必不能超过SQL长度限制,通过max_allowed_packe配置可以修改,默认是1M。
2. 事务需要控制大小,事务太大可能会影响执行的效率。MySQL有innodb_log_buffer_size配置项,超过这个值会日志会使用磁盘数据,这时,效率会有所下降。所以比较好的做法是,在事务大小达到配置项数据级前进行事务提交。
3. DML语句可以采用事务处理,DDL则不支持事务,实际上若对DDL使用事务,只有最后一条真正执行。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值