关于java代码解析excel,使用sax解析

本文介绍了由于使用apache.poi解析Excel导致内存溢出的问题,并探讨了Excel文件结构,着重分享了一种使用SAX解析大文件Excel的方法,以减少内存消耗。虽然代码尚待完善,博主寻求对sheet与sharedString文件协同读取和SAX解析终止的解决方案。
摘要由CSDN通过智能技术生成

关于excel解析:
目前网上大多数方法都是利用 apache.poi来解析。
但是上个星期由于一些问题导致内存溢出,原因是poi解析会读取所有的单元格,每一个单元格作为一个对象,而excel中的一些操作会导致没有数据的单元格也被读取,最终导致系统GG。

这是我用于测试的excel:在这里插入图片描述
在这里插入图片描述

将文件重命名后(加后缀.zip):
在这里插入图片描述
再打开:在这里插入图片描述
在这里插入图片描述在这里插入图片描述

xl中包含了excel中的绝大数内容,worksheets中的sheet.xml包含了大部分的数据,sharedString.xml
则包含了sheet.xml中的某些单元格对应的字符串。
目前博主对于excel的了解仅限于此,所以写的代码不是很好,请谅解。

在找了许多资料后和试了几种方法,最终写出来的代码,目前能解析出对应的数据,但是还不知道有什么问题
博主实力不济,仅供参考,有错误请指正,谢谢

ps:关于sheet文件与sharedString文件如何一起读取赋值,还有终止sax解析目前没有解决,希望大家能指点指点

代码



import java.io.IOException;
import java.io.InputStream;
import java.util.ArrayList;
import java.util.List;
import java.util.zip.ZipEntry;
import java.util.zip.ZipFile;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;

/**
 * 读取Excel文件--- 不稳定
 */
public class ExcelIO {
   
    /**
     * @param 文件地址,列数,行数 无法控制行数,当文件数据过多超过所传参数,报错,终止读取 将所读取的数据以字符串的形式存储
     * @return 返回一个字符串数组列表
     */
    static List<String[]> readExcelIo(String url, int proNum, int rowNum)
            throws IOException, ParserConfigurationException, SAXException {
   
        // 读取Excel文件
        ZipFile file = new ZipFile(url);
        
        // 压缩文件读取,可以读取到压缩文件中的具体文件
        // 这里只读第一个Sheet,在workbook.xml中有sheet的记录,读取workbook文件可以获得
        ZipEntry sheet1File = file.getEntry("xl/worksheets/sheet1.xml");
        
        ZipEntry sharedStringFile = file.getEntry("xl/sharedStrings.xml");

        // sheet输入流
        InputStream sheet1In = file.getInputStream(sheet1File);

        // sharedString输入流
        InputStream sharedStringIn = file.getInputStream(sharedStringFile);

        // sax解析
        SAXParserFactory sax = SAXParserFactory.newInstance();
        SAXParser parser = sax.newSAXParser();

        // 创建sheet文件t处理对象
        SheetHandler sheet1Handler = new SheetHandler(proNum, rowNum);
        parser.parse(sheet1In, sheet1Handler);

        // 创建sharedString文件处理对象
        SharedStringHandler sharedStringHandler = new SharedStringHandler();
        parser.p
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值