1. 什么是EasyExcel
EasyExcel是阿里出品的一款基于Java语言的Excel文件读写工具,使用简单,节省内存。它基于Apache Poi框架实现,解决了Poi耗内存大的问题,并且避免了大部分内存溢出情况。EasyExcel封装了许多模型转换的操作,使用起来十分简便。
1.1 EasyExcel的基本原理
目前主流的excel文件格式为07版的.xlsx,以及03版的xls,这种使用起来极其方便的表格文件,内部其实是由.xml文件来组成的。利用解压缩工具打开.xlsx文件,在worksheets文件夹中可以找到数据对应的.xml文件。
EasyExcel框架设计使用了监听器模式,通过对应版本的Sax解析器来解析这些.xml文件,每次解析一行数据,然后调用一次监听器。
相较于Poi,Poi也有使用过Sax解析器解析文件,但操作环境是在内存中,因此解析大文件时很容易出现OOM(内存溢出)。
EasyExcel之所以能大大减少内存的占用,是因为其解压缩和解析操作是在磁盘中进行的,因此占用内存很少,即使是大的Excel文件,也不会产生很大的内存占用。
下面是EasyExcel与Poi的解析流程对比:
EasyExcel一条一条的解析表格数据,每当解析完一条数据,都会去调用监听器中的invoke()方法,对数据进行操作。为了提高效率,方便清理内存,每次解析完的一条数据,都会被存放在list集合中。因此,当list集合中的数据达到一定数量后,需要将数据处理掉,清理list集合。这样就实现了内存的释放,避免了内存溢出。
此外,EasyExcel还使用了Java对象+字段注解的方式来转换Excel数据,解析器可以自动根据字段注解来查找对应列,获取数据,比Poi的getCell方法方便了很多。
@ExcelProperty("手机号")
private String phone;
接下来,就一起来看一下EasyExcel是怎么使用的:
2. 如何使用EasyExcel
2.1读取Excel
创建一个小Demo,用来演示EasyExcel读取Excel文件内容并存储。用到了Maven+SpringBoot。
maven依赖:
<!--easyexcel-->
<dependency>
<groupId>com.alibaba</groupId>
<artifactId>easyexcel</artifactId>
<version>2.1.6</version>
</dependency>
<!--fastjson-->
<dependency>
<groupId>com.alibaba</groupId>
<artifactId>fastjson</artifactId>
<version>1.2.72</version>
<scope>test</scope>
</dependency>
<!--lombok-->
<dependency>
<groupId>org.projectlombok</groupId>
<artifactId>lombok</artifactId>
</dependency>
- 首先根据Excel内容创建java对象。
@Data
public class User{
@ExcelProperty("手机号")
private String phone;
@ExcelProperty("姓名")
private String nickname;
@ExcelProperty("公司")
private String companyName;
@ExcelProperty("职位")
private String position;
}
上面提到过,EasyExcel可以根据注解来找到对应列,这个注解就是@ExcelProperty(),里面有两个属性:value–列名,index:列的顺序(第几列)
- 创建数据处理类(这里命名为Service)。
@Service
public class DemoService {
@SneakyThrows // @SneakyThrows抛异常注解
public void saveString(List<User> lists, String newPath) {
// 输出流
OutputStream outputStream = new FileOutputStream