poi百万数据读取

本文介绍了如何使用Apache POI的事件模式处理大量Excel数据,避免内存不足的问题。通过逐行扫描和SAX解析,实现了对百万级别数据的高效读取,详细阐述了设置POI事件模式、自定义Sheet处理器和Sax解析的过程。
摘要由CSDN通过智能技术生成

需求分析

使用POI基于事件模式解析案例提供的Excel文件

思路分析

用户模式:加载并读取Excel时,是通过一次性的将所有数据加载到内存中再去解析每个单元格内容。当Excel
数据量较大时,由于不同的运行环境可能会造成内存不足甚至OOM异常。
事件模式:它逐行扫描文档,一边扫描一边解析。由于应用程序只是在读取数据时检查数据,因此不需要将
数据存储在内存中,这对于大型文档的解析是个巨大优势。

步骤分析

(1)设置POI的事件模式
根据Excel获取文件流
根据文件流创建OPCPackage
创建XSSFReader对象
(2)Sax解析
自定义Sheet处理器
创建Sax的XmlReader对象
设置Sheet的事件处理器 逐行读取

原理分析

我们都知道对于Excel2007的实质是一种特殊的XML存储数据,那就可以使用基于SAX的方式解析XML完成Excel的
读取。SAX提供了一种从XML文档中读取数据的机制。它逐行扫描文档,一边扫描一边解析。由于应用程序只是在
读取数据时检查数据,因此不需要将数据存储在内存中,这对于大型文档的解析是个巨大优势

原理
代码实现
自定义处理器

import org.apa
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值