关于excel解析:
目前网上大多数方法都是利用 apache.poi来解析。
但是上个星期由于一些问题导致内存溢出,原因是poi解析会读取所有的单元格,每一个单元格作为一个对象,而excel中的一些操作会导致没有数据的单元格也被读取,最终导致系统GG。
这是我用于测试的excel:
将文件重命名后(加后缀.zip):
再打开:
xl中包含了excel中的绝大数内容,worksheets中的sheet.xml包含了大部分的数据,sharedString.xml
则包含了sheet.xml中的某些单元格对应的字符串。
目前博主对于excel的了解仅限于此,所以写的代码不是很好,请谅解。
在找了许多资料后和试了几种方法,最终写出来的代码,目前能解析出对应的数据,但是还不知道有什么问题
博主实力不济,仅供参考,有错误请指正,谢谢
ps:关于sheet文件与sharedString文件如何一起读取赋值,还有终止sax解析目前没有解决,希望大家能指点指点
代码
import java.io.IOException;
import java.io.InputStream;
import java.util.ArrayList;
import java.util.List;
import java.util.zip.ZipEntry;
import java.util.zip.ZipFile;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;
/**
* 读取Excel文件--- 不稳定
*/
public class ExcelIO {
/**
* @param 文件地址,列数,行数 无法控制行数,当文件数据过多超过所传参数,报错,终止读取 将所读取的数据以字符串的形式存储
* @return 返回一个字符串数组列表
*/
static List<String[]> readExcelIo(String url, int proNum, int rowNum)
throws IOException, ParserConfigurationException, SAXException {
// 读取Excel文件
ZipFile file = new ZipFile(url);
// 压缩文件读取,可以读取到压缩文件中的具体文件
// 这里只读第一个Sheet,在workbook.xml中有sheet的记录,读取workbook文件可以获得
ZipEntry sheet1File = file.getEntry("xl/worksheets/sheet1.xml");
ZipEntry sharedStringFile = file.getEntry("xl/sharedStrings.xml");
// sheet输入流
InputStream sheet1In = file.getInputStream(sheet1File);
// sharedString输入流
InputStream sharedStringIn = file.getInputStream(sharedStringFile);
// sax解析
SAXParserFactory sax = SAXParserFactory.newInstance();
SAXParser parser = sax.newSAXParser();
// 创建sheet文件t处理对象
SheetHandler sheet1Handler = new SheetHandler(proNum, rowNum);
parser.parse(sheet1In, sheet1Handler);
// 创建sharedString文件处理对象
SharedStringHandler sharedStringHandler = new SharedStringHandler();
parser.p