在工作中,由于导出大量数据,导致系统变卡甚至挂掉,查看代码发现导出使用的是POI的HSSF导出,领导让我将POI替换成EasyExcel来解决此问题
同时产生疑惑,为什么EasyExcel可以做到低内存占用,为此查看了源码:
HSSF
HSSF在导出时,数据全部存于内存中,会占用较大内存,可能会造成内存溢出,同时,使用HSSF导出会有最大行数限制,当超过65536行时,会异常提示,终止本次导出
EasyExcel
下图从调用写方法开始进行源码剖析:
经过几个write方法调用,发现从下图中代码开始循环每一行数据进行操作
进入上图中的方法,发现在此方法中开始创建row对象,同时传入当前行数
进入此方法发现,在创建Row对象时,进行了行数比较,若当前行数>100时,会在磁盘生成临时文件保存这些数据
经过此次查看源码,知道了EasyExcel使用的是SXSSF方式创建Row对象,而SXSSF会判断数据量,当超过阈值_randomAccessWindowSize,即:100时,会通过flushRows的方式将多余数据放在磁盘的临时文件中存储,就是通过这种将数据放到磁盘中的方式降低内存占用,防止内存溢出