apache官方提供了使用sax方式处理大数据量的xlsx文件,可以防止内存的溢出,经过测试其实是占用的内存大大减少,但是最近在使用的时候发现使用了sax内存仍然会飙到2G,甚至3G,一开始找不到原因
使用jmap -histo命令显示内存中创建的实例数量
num #instances #bytes class name
----------------------------------------------
1: 1386 765536640 [B
2: 7679 688056 [C
3: 1640 187744 java.lang.Class
4: 7515 180360 java.lang.String
5: 1088 73896 [Ljava.lang.Object;
6: 958 59960 [I
发现Byte的占用非常的高,心想应该是流的问题,但是查看代码发现代码中流使用合理,正常关闭,然后查看了poi使用的方法,发现了内存飙升的地方在调用
OPCPackage pkg = OPCPackage.open(file);
后通过查看源码,open有多个重载,我使用的是参数为InputStream的重载,官方文档上写的是File,我当时为了方便直接使用了InputStream的重载,结果发现两个重载对文件的处理不一样,如果使用InputStream的重载,会出现内存飙升的情况,换成File的就没事了