背景
使用mysqlPlus. 不管是updateBatch
, 还是saveBatch
, 800条左右的数据,
耗时都超过1s以上
尝试更改每次批量处理的数量, 比如:
super.updateBatchById(list,1000);
如果不传第二个参数, mysqlPlus默认是1000. 这个根据调整, 发现低于1000, 耗时增加,1500
到2500
ms左右, 因为sql分多次执行, 中间IO请求的耗时比较大.
设置为1000(因为总共测试数据都没有1000, 所以没有尝试更大的值), 为900
ms到1200
ms左右.
这时间太久了,在网上找办法.
处理
最后发现在sql链接后追加: rewriteBatchedStatements=true
. 再次尝试, 已经缩减到100
ms!
url: jdbc:mysql://localhost:3306/zgd?useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertToNull&rewriteBatchedStatements=true
补充
在看源代码的时候, 发现mybatisPlus会预编译插入的sql, 如果一条记录A,B,C都有值, 则预编译为 values(?,?,?) ,且如果下一条又是三个字段都有值就直接合并一条sql.
但是如果遇到A,B有值,C没有值, 就会重现编译一条sql values(?,?)
所以如果我们查出来的数据,有些字段是null,且不怎么规则的时候,批量save会预编译出很多条sql
要解决这个问题, 一个是可以自己手动设置非null的初始值, 另一种方式是在可能为null的字段上加,insertStrategy = FieldStrategy.IGNORED,fill = FieldFill.DEFAULT
, 它表示插入的时候不校验是否为null, 都给你编译一个?占位
在修改之前, 发现打印的日志有很多条编译的insert sql. 修改只有就只有一条 values(?,?,?)