java查询结果数据量过大

在Java服务中,尝试通过MyBatis的流式查询解决大数据量查询导致的内存溢出(OOM)问题。代码展示了如何使用Cursor进行流式处理,但即使如此,在生产环境中针对几十万数据的查询仍出现OOM。问题可能源于查询结果过大。解决方案仍在探索中,目前流式查询并未能有效防止OOM。
摘要由CSDN通过智能技术生成

场景:

从db中查询数据,并根据查询的结果去构造参数,然后去更新另一张表。由于一次性查询出的结果量过大,很有可能造成OOM。

解决办法:

采用mybais流式查询

废话不多说,先上完成后的代码:

Service层:

@Service
@Slf4j
public class MarcInstanceServiceImpl implements MarcInstanceService {

    @Autowired
    private MarcInstanceDao marcInstanceDao;
    @Autowired
    private InstanceInfoDao instanceInfoDao;

    /**
     * 重新生成other_title
     */
    @Override
    @Transactional(rollbackFor = Exception.class)
    public Integer rebuildOtherTitle() throws IOException {
        AtomicInteger count = new AtomicInteger(0);
        try (Cursor<MarcInstanceEntity> cursor = marcInstanceDao.getRepeat517Marc()) {
            cursor.forEach(marcInstanceEntity -> {
                // 构造参数
                // 省略。。。
                // 去做更新表操作
               count.addAndGet(instanceInfoDao.updateOtherTitleById(marcInstanceEntity));
                log.info("更新第{}条other_title", count.get());
            });
        }
        log.info("总共更新{}条other_title", count.get());
        return count.get();
    }
}

其中:

1)marcInstanceDao.getRepeat517Marc()会做大数据量的查询,大概几十万左右。

2)count.addAndGet是计数使用。

3)instanceInfoDao.updateOtherTitleById是根据查询到的结果去更新表。

经过少量数据测试,没有问题。

// todo 进行大批量的数据测试,有结果后会更新到这儿。。。

2022-05-18更新:

经过测试,不到11万的数据量,用时大概3分钟左右,正常结束。

2022-05-20更新:

生产环境OOM了。。。我真是个傻狗。

事情经过:接口如上所写,然后启动给了1024M内存,调用接口,结果OOM。然后重新给2048M,调用接口,还是OOM。最后不限制内存了才能正常调用。

所有这个流式查询并没有解决OOM的问题,原因大概猜到了,应该是:marcInstanceDao.getRepeat517Marc()过大导致的。

综上:这种流式查询并不能解决可能出现OOM的问题。后续待优化。。。

参考:

https://blog.csdn.net/pastxu/article/details/124338586

Java中批量查询大量数据,可以使用JDBC的分页查询功能来实现。具体步骤如下: 1. 建立数据库连接,创建Statement对象。 2. 编写分页查询SQL语句,使用LIMIT和OFFSET子句来分页查询数据。 3. 设置每页查询数据量batchSize,循环查询数据,将查询结果添加到List中。 4. 关闭数据库连接,处理查询结果。 以下是一个Java代码示例,演示如何使用JDBC批量查询大量数据: ```java import java.sql.*; import java.util.ArrayList; import java.util.List; public class BatchQuery { public static void main(String[] args) { String url = "jdbc:mysql://localhost:3306/mydatabase"; String user = "root"; String password = "123456"; int batchSize = 10000; int offset = 0; List<String> results = new ArrayList<>(); try (Connection conn = DriverManager.getConnection(url, user, password); Statement stmt = conn.createStatement()) { while (true) { // 编写分页查询SQL语句 String sql = "SELECT * FROM mytable LIMIT " + batchSize + " OFFSET " + offset; ResultSet rs = stmt.executeQuery(sql); // 如果没有更多数据,退出循环 if (!rs.next()) { break; } do { // 将查询结果添加到List中 String result = rs.getString("column_name"); results.add(result); } while (rs.next()); // 更新偏移量 offset += batchSize; } } catch (SQLException e) { e.printStackTrace(); } // 处理查询结果 for (String result : results) { System.out.println(result); } } } ``` 这段代码会将您的数据分批查询,每批查询10000条数据,直到查询完整个中的所有数据。您可以根据需要修改批次大小。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值