封装Apache POI读写Excel文件(包括超大Excel)
最近在工作中,需要处理大量的Excel文件,这些Excel文件有xls(97-2003)和xlsx(2007-later)等等,不仅如此,这些Excel文件都比较庞大,使得处理过程变得耗时费力,为了提高效率,减少重复工作量,我仔细研究了一下Apache POI处理Excel的机制,再结合其他大佬的一些实现,然后封装了一套通用的接口。
Excel小文件处理
先说一下如何处理Excel小文件,处理容量较小的Excel文件其实是非常简单的。
这里我们规定不超过5W行的的都算做Excel小文件,对于超过5W行的记录,我们一般采取SXSSF (Streaming User API)和Event Driven 模式进行处理,如果强行采用普通模式(UserModel)处理超大的Excel文件,会出现Out Of Memory异常,或者处理非常缓慢的情况。
那么处理Excel小文件,我们希望最终的效果类似下面这样:
//Read excel file
ExcelReader.read(inputStream).map(this::transform).toList();
//or like this
ExcelReader.read(MultipartFile).map(this::transform).toList();
//or like this
ExcelReader.read(file).map(this::transform)