LBruce 你好:
其实想要解决 saveAll 批量插入慢的问题,我们需要两个步骤的操作。第一个步骤是非常简单的,因为 JPA 支持批量插入,所以,你可以设置一个批次执行多少条数据写入。例如,我们可以这样配置 JPA:spring:
jpa:
properties:
hibernate:
jdbc:
batch_size: 500
batch_versioned_data: true
order_inserts: true
order_updates: true
batch_size 就是批量插入的个数,我这里建议设置为 500,这样的话,如果你要插入1000条数据,其实,两个批量在毫秒级别就完成了。
但是,仅仅这样设置是不够的,我们来看一看 saveAll 的源码(位于 org.springframework.data.jpa.repository.support.SimpleJpaRepository 文件中):/*
* (non-Javadoc)
* @see org.springframework.data.jpa.repository.JpaRepository#save(java.lang.Iterable)
*/
@Transactional
public List saveAll(Iterable entities) {
Assert.notNull(entities, "The given Iterable of entities not be null!");
List result = new ArrayList();
for (S entity : entities) {
result.add(save(entity));
}
return result;
}
可以清晰的看到,JPA 的实现只是调用 for 循环实现插入,那么,我们再去看看 save 方法是怎么实现的:@Transactional
public S save(S entity) {
if (entityInformation.isNew(entity)) {
em.persist(entity);
return entity;
} else {
return em.merge(entity);
}
}
其实问题就出在这里了,entityInformation.isNew 这句代码的含义是:去数据库查询这条数据是否存在,如果存在,则是修改动作;否则,就是插入新的数据。那么,对于我们的批量插入来说,你需要修改(重写)saveAll 方法,非常简单,一样是调用 for 循环不断的 persist 就可以了,避免了每次的查询操作。
我是勤一,致力于将这门课程的问答区打造为 Java 知识体系知识库,Java 知识体系 BBS!共同建造、维护这门课程,我需要每一个你!