背景
用户修改布局时,需要批量更新mysql的xxxx_layout_xxxx表。批量操作的数据量是2-30条/次。批量操作是这次项目在技术上比 较关键的一个点,之前批量操作做过性能上的测试,mysql端问题不大,7000+tps,Java端的效率有些差,有优化空间。
对批量的性能进行了测试,优化。过程如下。
经测试,批量更新30条记录的时间是35ms。由于数据在mysql服务端中会有内存缓存,批量更新30条的时间用了35ms,感觉有些长,试图找出原因。
使用截包工具(这里用的ethereal),抓取mysql的数据包,下面是一次批量更新的数据包:
可以看出,批量更新时,每条update语句都去mysql请求了一次。并没有打包发给mysql。这种批量的效率肯定不会高。同样方法试了下oracle数据库,oracle驱动做的就很好,一次批量是打包在同一个请求中,是真正的批量提交,效率自然比mysql高。
找了些资料,发现mysql默认情况确实是不支持batch。为了解决上面的问题,需要给JDBC连接加上参数rewriteBatchedStatements=true,并且jdbc driver需要升级到5.1.8以上才支持这个参数。
增加参数rewriteBatchedStatements=true,driver版本升到5.1.17后,再次测试,批量更新30条的时间从35ms降到了11ms。截包后,可以看出底层的机制,已经变成批量提交:
查看包的内容可以发现,这条请求里,封装了30条update语句
横坐标: 一次批量更新的条数。纵坐标:更新100次所用时间(ms)
可见,当批量条数增加时,rewriteBatchedStatements=true的性能有很大优势。即使数量少时,也还是有一定优势。
结论:
使用rewriteBatchedStatements=true参数,对批量操作,性能有较大提高,从官方解释上看,对普通操作没有影响。 从网上资料和自己的测试上看,暂时没有发现rewriteBatchedStatements=true参数Driver版本5.1.17的问题。 因此,本项目中计划采取下面优化措施:
- JDBC Driver版本从5.0.4升级到5.1.17。
- 连接属性中加入rewriteBatchedStatements=true参数
附:
测试环境:
mysql JDBC 3.0.4/3.1.17。
客户端: 普通PC机。
连接池数: 1-10。
10线程并发,批量更新30条记录(索引有效),循环更新100次。
批量更新主要代码:
mmpSqlMapClient.startTransaction(); // 使用事务
mmpSqlMapClient.startBatch(); // 批量提交
for (ChannelLayoutDO channelLayout: userChannelLayoutList) { mmpSqlMapClient.update(“UserChannelLayoutDAO.updateSort”, channelLayout);
}
mmpSqlMapClient.executeBatch();
mmpSqlMapClient.commitTransaction();