使用EntityManager批量保存数据

@PersistenceContext

EntityManager em;

从别的系统中定期同步某张表的数据,由于数据量较大,采用批量保存

JPA EntityManager的四个主要方法

① public void persist(Object entity)

persist 方法可以将实例转换为 managed( 托管 ) 状态。在调用 flush() 方法或提交事物后,实例将会被插入到数据库中。

     ② public void merge(Object entity)

merge 方法的主要作用是将用户对一个 detached 状态实体的修改进行归档,归档后将产生一个新的managed 状态对象。

如果Entity是新创建的,则这个方法类似于persist()这个方法。

如果Entity已经存在的,则只作为更新操作。

③ public void refresh(Object entity)

 refresh 方法可以保证当前的实例与数据库中的实例的内容一致。

④ public void remove(Object entity)

 remove 方法可以将实体转换为 removed 状态,并且在调用 flush() 方法或提交事物后删除数据库中的数据。
⑤ public void flush()

将PersistenceContext的信息同步到数据库中。

  当触发Flush这个动作的时候,所有的实体都将会被insert/update/remove到数据库中。

  数据库不会触发Commit的操作。

⑥    public void refresh (Object entity)

Refresh的作用是从数据库中将Entity的状态进行更新操作。如果Entity和数据库中的数据不一致,将更新数据库中的数据到Entity中。

 public void clear()

分离所有当前正在被管理的实体 —— clear()
在处理大量实体的时候,如果你不把已经处理过的实体从EntityManager中分离出来,将会消耗你大量的内存。调用 EntityManager 的clear()方法后,所有正在被管理的实体将会从持久化内容中分离出来。有一点需要说明下,在事务没有 提交前(事务默认在调用堆栈的最后提交,如:方法的返回),如果调用clear()方法,之前对实体所作的任何改变将会掉 失,所以建议你在调用clear()方法之前先调用flush()方法保存更改。


public void eamMaterialCodeDatabase(){
	String updateTimeStr = eamMaterialCodeService.getUpdateTimeStr();
	SQLBuilder sb = new SQLBuilder("IFSAPP.INVENTORY_PART");
	sb.addField("DESCRIPTION name");
	sb.addField("PART_NO code");
	sb.addField("TYPE_DESIGNATION type");
	sb.addWhereClause(" CONTRACT = 'RS'");
	sb.setWithSemicolon(false);
	String sql = sb.createQuery();
	List objects = eamJT.queryForList(sql);
			
	List<EamMaterialCode> wantToSaved = new ArrayList<EamMaterialCode>();
	
	for (Object obj : objects) {
		Map objs = (Map) obj;
		EamMaterialCode eamMaterialCode = new EamMaterialCode();
		eamMaterialCode.setName((String)(objs.get("name") == null ? "" : objs.get("name")));
		eamMaterialCode.setType((String)(objs.get("type") == null ? "" : objs.get("type")));
		eamMaterialCode.setCode((String)(objs.get("code") == null ? "" : objs.get("code")));
		eamMaterialCode.setVersion(1);
	
		EamMaterialCode eamMaterialCode2 = eamMaterialCodeService.findByCode(eamMaterialCode.getCode());
		if (eamMaterialCode2 == null) {
			wantToSaved.add(eamMaterialCode);
		} else {
			int version = eamMaterialCode2.getVersion() + 1;
			eamMaterialCode.setId(eamMaterialCode2.getId());
			BeanUtils.copyProperties(eamMaterialCode, eamMaterialCode2);
			eamMaterialCode2.setVersion(version);
			wantToSaved.add(eamMaterialCode2);
		}
	}
	
	eamMaterialCodeService.batchInsertAndUpdate(wantToSaved);
}

@Transactional(readOnly = false)
    public void batchInsertAndUpdate(List list) {
            int size =  list.size();
        for (int i = 0; i < size; i++) {
        	BaseEntity dd = (BaseEntity) list.get(i);
        	if (dd.isNew()) {
        		 em.persist(dd);
        	} else {
        		em.persist(em.merge(dd));
        	}
            if (i % 1000 == 0 || i==(size-1)) { // 每1000条数据执行一次,或者最后不足1000条时执行
                em.flush();
                em.clear();
            }
        }
    }


### Spring Boot 后端批量插入数据实现方法 在处理大量数据时,批处理操作可以显著提高性能并减少数据库连接次数。对于Spring Boot应用程序而言,可以通过JPA或原生SQL语句来执行高效的批量插入。 #### 使用 JPA 实现批量插入 为了利用JPA进行批量保存实体对象,在配置文件中设置`spring.jpa.properties.hibernate.jdbc.batch_size=50`以启用Hibernate的批量更新功能[^1]: ```properties spring.jpa.properties.hibernate.jdbc.batch_size=50 ``` 定义一个简单的Entity类用于演示目的: ```java @Entity public class User { @Id @GeneratedValue(strategy = GenerationType.IDENTITY) private Long id; private String name; // Getters and Setters... } ``` 创建Repository接口继承自`CrudRepository<User,Long>`或者更具体的`JpaRepository<User,Long>`以便访问持久化层的功能: ```java @Repository public interface UserRepository extends JpaRepository<User, Long> {} ``` 编写Service组件负责业务逻辑以及调用存储库中的saveAll()函数完成多条记录的同时写入动作: ```java @Service public class UserService { @Autowired private UserRepository userRepository; public void saveUsers(List<User> users){ userRepository.saveAll(users); } } ``` 如果希望进一步优化性能,则可以在事务管理器的作用域内手动控制flush行为从而避免过多不必要的I/O请求发送给DBMS服务器: ```java @Transactional public void bulkSaveWithFlushControl(){ List<User> userList = generateUserList(); int batchSize = 50; for (int i = 0; i < userList.size(); i++) { userRepo.save(userList.get(i)); if ((i + 1) % batchSize == 0 ) { // Flush a batch of inserts and release memory. entityManager.flush(); entityManager.clear(); } } } ``` #### 使用 Native SQL 执行高效大批量加载 当面对非常庞大的数据集时,考虑采用直接向目标表提交INSERT INTO ... VALUES(...)形式的命令字符串可能更加合适;这种方式绕过了ORM框架带来的额外开销并且允许开发者灵活调整参数绑定机制。 通过声明式方式指定查询模板,并借助于`@Modifying`注解表明这是一个修改型的操作而非只读式的检索过程: ```java public interface BatchInsertRepository extends CrudRepository<User, Long> { @Transactional @Modifying(flushAutomatically = true, clearAutomatically=true) @Query(value="INSERT INTO USER(NAME) VALUES(?1)", nativeQuery = true) void insertBatch(String... names); } ``` 上述例子展示了如何接受可变数量的名字作为输入并通过占位符?N的形式传递到预编译后的SQL表达式里去填充实际值的位置。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值