Java POI SAX模式 读取大数据Excel

本文介绍了一种解决大数据Excel导入问题的方法,使用Java POI库的SAX模式来避免内存溢出。SAX模式可以事件驱动地读取Excel文件,将大部分数据解析为String类型,但对日期格式数据需要特别处理。提供了相关代码示例。
摘要由CSDN通过智能技术生成

业务描述:
后缀为.xlsx的Excel文件,只有一个sheet页,且该sheet页对应数据库中的1张表,从A1开始有数据,第1行的数据对应表的各个字段,从第2行开始是要导入的数据,将该Excel导入到数据库中
解决方案:
因为Excel包含大量数据,如果采用POI的用户模式,会消耗大量内容,容易造成内存溢出

java.lang.OutOfMemoryError

所以这里采用SAX模式(事件模式)读取,需要注意的是SAX模式读取,大部分格式的数据都可以读取成String类型,日期格式不在此列,需要特殊处理,处理方式详见下方code
code:

import java.io.InputStream;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.Iterator;
import java.util.regex.Pattern;

import org.apache.log4j.Logger;
import org.apache.poi.openxml4j.opc.OPCPackage;
import org.apache.poi.ss.usermodel.DataFormatter;
import org.apache.poi.xssf.eventusermodel.XSSFReader;
import org.apache.poi.xssf.model.SharedStringsTable;
import org.apache.poi.xssf.model.StylesTable;
import org.apache.poi.xssf.usermodel.XSSFCellStyle;
import org.apache.poi.xssf.usermodel.XSSFRichTextString;
import org.xml.sax.Attributes;
import org.xml.sax.ContentHandler;
import org.xml.sax.InputSource;
import org.xml.sax.SAXException;
import org.xml.sax.XMLReader;
import org.xml.sax.helpers.DefaultHandler;
import org.xml.sax.helpers.XMLReaderFactory;

/**
 * <p>ClassName: ExampleEventUserModel</p>
 * <p>Description: 事件模式</p>
 * <p>Author: sloth</p>
 * <p>Date: 2018-02-28</p>
 */
public class ExampleEventUserModel {
   
    /**
     * <p>Field stylesTable: 单元格样式</p>
     */
    public static StylesTable stylesTable;

    /**
     * <p>Description: 处理单个sheet(本案例调用此方法)</p>
     * @param filename 文件名带路径
     * @throws Exception 异常
     */
    public void processOneSheet(String filename) throws Exception {
        OPCPackage pkg = OPCPackage.open(filename);
        XSSFReader r = new XSSFReader(pkg);
        SharedStringsTable sst = r.getSharedStringsTable();
        stylesTable = r.getStylesTable();
        XMLReader parser = fetchSheetParser(sst);

        // To look up the Sheet Name / Sheet Order / rID,
        // you need to process the core Workbook stream.
        // Normally it's of the form rId# or rSheet#
        InputStream sheet = r.getSheet("rId1");
        InputSource sheetSource = new InputSource(sheet);
        parser.parse(sheetSource);
        sheet.close();
    }

    
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值