POI和EasyExcel
常用信息
- 将用户导出为excel表格
- 将excel表中的数据录入到网站数据库
Apache POI
Apache POI [1] 是用Java编写的免费开源的跨平台的 Java API,Apache POI提供API给Java程式对[Microsoft Office](https://baike.baidu.com/item/Microsoft Office)格式档案读和写的功能
基本功能
- HSSF - 提供读写[Microsoft Excel](https://baike.baidu.com/item/Microsoft Excel) XLS格式档案的功能。
- XSSF - 提供读写Microsoft Excel OOXML XLSX格式档案的功能。
- HWPF - 提供读写[Microsoft Word](https://baike.baidu.com/item/Microsoft Word) DOC格式档案的功能。
- HSLF - 提供读写Microsoft PowerPoint格式档案的功能。
- HDGF - 提供读[Microsoft Visio](https://baike.baidu.com/item/Microsoft Visio)格式档案的功能。
- HPBF - 提供读[Microsoft Publisher](https://baike.baidu.com/item/Microsoft Publisher)格式档案的功能。
- HSMF - 提供读[Microsoft Outlook](https://baike.baidu.com/item/Microsoft Outlook)格式档案的功能。
xls(03)和xls(07)的区别
- xls(03)最大行数为65535,xls(07)没有最大行数的限制
- xls(03)后缀名为xls,xls(07)后缀名为xlsx
数据批量写入
- 大文件写入HSSF
- 缺点
- 最对只能处理65536行,否则会抛出异常
- 优点
- 过程写入缓存,不操作磁盘,最后一次性写入磁盘,速度快
- 缺点
- 大文件写入XSSF
- 缺点
- 写数据非常慢,非常耗内存,也会发生内存溢出,如100w条数据
- 优点
- 可以写较大的数据量
- 缺点
- 大文件写SXSSF
- 优点
- 可以写非常大的数据量,如100w条甚至更多条,写数据速度快,占用更少的内存
- 注意
- 过程中会产生临时文件,需要清理临时文件
- 默认由100条记录被保存再内存中,如果超过这数量,则最前面的数据被写入临时文件
- 如果想自定义内存中的数据量,可以使用new SXSSF(数量)
- 清除临时文件----> dispose()方法
- 优点
使用
-
导入依赖
-
<!-- xls(03)--> <!-- https://mvnrepository.com/artifact/org.apache.poi/poi --> <dependency> <groupId>org.apache.poi</groupId> <artifactId>poi</artifactId> <version>3.17</version> </dependency> <!-- xls(07)--> <!-- https://mvnrepository.com/artifact/org.apache.poi/poi-ooxml --> <dependency> <groupId>org.apache.poi</groupId> <artifactId>poi-ooxml</artifactId> <version>3.17</version> </dependency> <!-- 日期格式化工具--> <!-- https://mvnrepository.com/artifact/joda-time/joda-time --> <dependency> <groupId>joda-time</groupId> <artifactId>joda-time</artifactId> <version>2.10.10</version> </dependency>
-
-
xls(03)生成
-
//创建工作薄 HSSFWorkbook workbook = new HSSFWorkbook(); //创建工作表 HSSFSheet sheet = workbook.createSheet(); //创建行 (0,0)坐标---->(0,0)单元格 HSSFRow row = sheet.createRow(0); //创建列 HSSFCell cell = row.createCell(0); //向单元格中添加数据 cell.setCellValue("test"); //将文件输出 FileOutputStream outputStream = new FileOutputStream(path + "03.xls"); workbook.write(outputStream); outputStream.close();
-
xlsx(07)生成只需要将workbook类型更改为XSSFWorkbook,后后缀名更改为xlsx即可
-
-
读取Excel表
-
读取xls(03)
-
FileInputStream fileInputStream = new FileInputStream(path + "03.xls"); HSSFWorkbook workbook = new HSSFWorkbook(fileInputStream); HSSFSheet sheet = workbook.getSheetAt(0); HSSFRow row = sheet.getRow(0); HSSFCell cell = row.getCell(0); System.out.println(cell.getStringCellValue());
-
读取XSSF表时,创建XSSF或者SXSSF对象,并更改xls后缀命为xlsx即可
-
-
EasyExcel
为什么使用easyExcel
Java解析、生成Excel比较有名的框架有Apache poi、jxl。但他们都存在一个严重的问题就是非常的耗内存,poi有一套SAX模式的API可以一定程度的解决一些内存溢出的问题,但POI还是有一些缺陷,比如07版Excel解压缩以及解压后存储都是在内存中完成的,内存消耗依然很大。easyexcel重写了poi对07版Excel的解析,能够原本一个3M的excel用POI sax依然需要100M左右内存降低到几M,并且再大的excel不会出现内存溢出,03版依赖POI的sax模式。在上层做了模型转换的封装,让使用者更加简单方便
EasyExcel是阿里巴巴开源的一个excel处理框架,以使用简单,节省内存著称
EasyExcel和POI的区别
- EasyExcel能大大减少占用内存的主要原因是再解析excel时没有将文件数据一次性全部加载到内存中,而是从磁盘上一行行读取数据,逐个解析
- POI事先将所有的文件数据一次性全部导入到内存中,如果导入的数据量太大,会导致OOM(内存移除问题)
本笔记来源于对b站up狂神说POI和EasyExcel的记录,仅用于个人学习使用。