· 批量处理数据是指在一个事务中处理大量数据.
· 在应用层进行批量操作, 主要有以下方式:
- 通过 Session
- 通过 HQL
- 通过 StatelessSession
- 通过 JDBC API( 效率最高, 速度最快)
(一)通过 Session 来进行批量操作
· Session 的 save() 及 update() 方法都会把处理的对象存放在自己的缓存中. 如果通过一个 Session 对象来处理大量持久化对象, 应该及时从缓存中清空已经处理完毕并且不会再访问的对象. 具体的做法是在处理完一个对象或小批量对象后, 立即调用 flush() 方法刷新缓存, 然后在调用 clear() 方法清空缓存
· 通过 Session 来进行处理操作会受到以下约束
需要在 Hibernate 配置文件中设置 JDBC 单次批量处理的数目, 应保证每次向数据库发送的批量的 SQL 语句数目与batch_size 属性一致
若对象采用 “identity” 标识符生成器, 则 Hibernate 无法在 JDBC 层进行批量插入操作 进行批量操作时, 建议关闭Hibernate 的二级缓存
例
批量更新: 在进行批量更新时, 如果一下子把所有对象都加载到 Session 缓存, 然后再缓存中一一更新, 显然是不可取的
- 使用可滚动的结果集 org.hibernate.ScrollableResults, 该对象中实际上并不包含任何对象, 只包含用于在线定位记录的游标. 只有当程序遍历访问 ScrollableResults 对象的特定元素时, 它才会到数据库中加载相应的对象. org.hibernate.ScrollableResults 对象由 Query 的 scroll方法返回
例
注:注意: HQL 只支持 INSERT INTO … SELECT 形式的插入语句, 但不支持 INSERT INTO … VALUES 形式的插入语句. 所以使用 HQL 不能进行批量插入操作.
(二)通过StatelessSession来进行批量操作
· 从形式上看,StatelessSession与session的用法类似。StatelessSession与session相比,有以下区别:
- StatelessSession没有缓存,通过StatelessSession来加载、保存或更新后的对象处于游离状态。
- StatelessSession不会与Hibernate的第二级缓存交互。
- 当调用StatelessSession的save()、update()或delete()方法时,这些方法会立即执行相应的SQL语句,而不会仅计划执行一条SQL语句
- StatelessSession不会进行脏检查,因此修改了Customer对象属性后,还需要调用StatelessSession的update()方法来更新数据库中数据。
- StatelessSession不会对关联的对象进行任何级联操作。
- 通过同一个StatelessSession对象两次加载OID为1的Customer对象,得到的两个对象内存地址不同。
- StatelessSession所做的操作可以被Interceptor拦截器捕获到,但是会被Hibernate的事件处理系统忽略掉。
(三)通过JDBC API
@Test
public void batch(){
session.doWork(new Work(){
@Override
public void execute(Connection connection) throws SQLException {
/*
String sql = "insert into deparment(name) values(?),values(?),values(?)";
Object[][]args = {{"test1"},{"test2"},{"test3"}};
queryRunner.batch(connection, sql, args);
*/
//System.out.println(connection);
// String sql = "insert into deparment(name) values('test4'),('test5'),('test6')";
String sql = "delete from deparment where id > 9";
connection.prepareStatement(sql).executeUpdate();
}
});
}