Excel文件解析

目录

前言

一、Excel文件解析

二、超大Excel文件读写


前言

在应用程序开发过程中,经常需要使用Excel文件来进行数据的导入或导出。所以,在通过Java语言来实现此类需求的时候,往往会面临着Excel文件解析(导入)或生成(导出)。

在Java技术生态圈中,可以进行Excel问价处理的主流技术包括:Apache POI,JXL,Alibaba EasyExcel等。

Apache POI基于DOM方式进行解析,将文件直接加载内存,所以速度较快,适合Excel文件数量不大的应用场景。JXL只支持Excel2003以下版本,所以不太常见。

Alibaba EasyExcel采用逐行读取的解析模式,将每一行的解析结果以观察者模式通知处理(AnalyEventListener),所以比较适合数据体量较大的Excel文件解析。

Apache POI

 Apache POI使用Java编写的免费开源的跨平台的Java API。Apache POI提供给Java程序对Microso Office 格式档案进行读写功能的API开源类库

一、Excel文件解析

XSSF解析Excel文件

HSSF用于解析旧版本(*.xls)Excel文件,由于旧版本的Excel文件只能存在65535行数据,所以目前已经不常用,现在主要采用XSSF进行新版本(*.xlsx)Excel文件的解析。

 Workbook(Excel文件)

Workbook接口代表一个Excel文件,用于创建或加载(解析)Excel文件,常见类是XSSFWorkbook。

创建Excel文件

//写法一

// 输出流
FileOutputStream fos = new FileOutputStream("文件名");

// Excel文件对象
Workbook workbook = new XSSFWorkbook();

// 通过输出流进行写入
workbook.write(fos);

// 关闭资源
fos.close();
workbook.close();


//写法二
try (Workbook workbook = new XSSFWorkbook();
				FileOutputStream fos = new FileOutputStream("文件名")) {
    workbook.write(fos);
} catch (IOException e) {
    e.printStackTrace();
}

解析Excel文件

// 输入流
FileInputStream fis = new FileInputStream("文件名");

// Excel文件对象
Workbook workbook = new XSSFWorkbook(fis);

Sheet(工作簿)

通过Workbook来进行工作簿Sheet对象的获取或创建

创建工作簿

// 按照默认名称创建工作簿
Sheet sheet4 = workbook.createSheet();

// 按照自定义名称创建工作簿
//创建工作簿
Sheet sheet0=workbook.createSheet("01");
Sheet sheet1=workbook.createSheet("02");
Sheet sheet2=workbook.createSheet("03");

 获取工作簿

// 按照工作簿下标获取Sheet
Sheet sheet01 = workbook.getSheetAt(0);

// 按照工作簿名称获取Sheet
Sheet sheet02 = workbook.getSheet("02");

//获取工作簿的数量
int n=workbook.getNumberOfsheets();

Row(数据行)

通过Sheet来进行数据行Row对象的获取或创建

代码实现:

//创建数据行
Row row = sheet.createRow(0);

//获取首行下标
int firstRow = sheet.getFirstRowNum();

//获取尾行下标
int lastRow = sheet.getLastRowNum();

//根据下标获取指定行
Row row = sheet.getRow(0);

//遍历行
//方法一(遍历所有行)
for(Row row : sheet) {
    System.out.println(row);
}

//方法二(可以遍历指定区域)
for (int i = 1; i <= sheet.getLastRowNum(); i++) {
    Row row = sheet.getRow(i);
    System.out.println(row);
}

//方法三(iterator)
Iterator<Row> it=sheet0.iterator();
while(it.hasNext()) {
	Row row=it.next();
     System.out.println(row);
}

Cell(单元格)

通过Row来进行单元格Cell对象的获取或创建

//创建单元格
Cell cell0 = row.createCell(0);

//设置单元格值
cell0.setCellValue(UUID.randomUUID().toString());

//根据下标获取单元格
Cell cell = row.getCell(1);

//遍历所有单元格
for(Cell cell : row) {
				
}

//获取单元格的类型
CellType type = cell.getCellType();

//设置单元格的样式
DataFormat dataFormat=workbook.createDataFormat();
short formatCode=dataFormat.getFormat("yyyy-MM-dd HH:mm:ss");

//创建cellStyle单元格式对象
CellStyle cellStyle=workbook.createCellStyle();
cellStyle.setDataFormat(formatCode);//设置成单元格格式编码

基本代码实现:

//Workbook对象:excel文件
//Sheet对象:电子工作簿
//Row对象:数据行
//Cell对象:单元格

public class Test02 {
	public static void main(String[] args) {
		try (Workbook workbook = new XSSFWorkbook(new FileInputStream("D:\\20220712.xlsx"))) {
			//获取工作簿
			Sheet sheet0=workbook.getSheet("sheet0");
			Iterator<Row> it=sheet0.iterator();
			//遍历工作簿中的所有行
			while(it.hasNext()) {
				Row row=it.next();
				//System.out.println(row);
				Cell cell0=row.getCell(0);//序号
				Cell cell1=row.getCell(1);//部门 
				Cell cell2=row.getCell(2);//姓名
				Cell cell3=row.getCell(3);//职位
				Cell cell4=row.getCell(4);//身份证号
				
				System.out.println("序号:"+(int)cell0.getNumericCellValue());
				System.out.println("部门:"+cell1.getStringCellValue());
				System.out.println("姓名:"+cell2.getStringCellValue());
				System.out.println("职位:"+cell3.getStringCellValue());
				System.out.println("身份证号:"+cell4.getStringCellValue());
				
			}
//			for(Row row:sheet0) {
//				Cell cell0=row.getCell(0);//序号
//				Cell cell1=row.getCell(1);//部门 
//				Cell cell2=row.getCell(2);//姓名
//				Cell cell3=row.getCell(3);//职位
//				Cell cell4=row.getCell(4);//身份证号
//				
//				System.out.println("序号:"+(int)cell0.getNumericCellValue());
//				System.out.println("部门:"+cell1.getStringCellValue());
//				System.out.println("姓名:"+cell2.getStringCellValue());
//				System.out.println("职位:"+cell3.getStringCellValue());
//				System.out.println("身份证号:"+cell4.getStringCellValue());
//			}
//			for(int i=0;i<=sheet0.getLastRowNum();i++) {
//				//得到当前数据行
//				Row row=sheet0.getRow(i);
//				//按照下标获取当前单元格
//				Cell cell0=row.getCell(0);//序号
//				Cell cell1=row.getCell(1);//部门 
//				Cell cell2=row.getCell(2);//姓名
//				Cell cell3=row.getCell(3);//职位
//				Cell cell4=row.getCell(4);//身份证号
//				
//				System.out.println("序号:"+(int)cell0.getNumericCellValue());
//				System.out.println("部门:"+cell1.getStringCellValue());
//				System.out.println("姓名:"+cell2.getStringCellValue());
//				System.out.println("职位:"+cell3.getStringCellValue());
//				System.out.println("身份证号:"+cell4.getStringCellValue());
//				
//			}
		} catch (IOException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		}
		
	}

}

二、超大Excel文件读写

使用POI写入

使用SXSSFWorkbook进入写入,通过设置SXXFWorkbook的构造参数,可以设置每次在内存中保持的行数,当达到这个值的时候,那么会把这些数据flush到磁盘上,这样就不会出现内心不够的情况。

代码实现:

package com.hwh.Test01;

import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.util.Arrays;
import java.util.Date;
import java.util.List;

import org.apache.poi.ss.usermodel.Cell;
import org.apache.poi.ss.usermodel.CellStyle;
import org.apache.poi.ss.usermodel.DataFormat;
import org.apache.poi.ss.usermodel.Row;
import org.apache.poi.ss.usermodel.Sheet;
import org.apache.poi.ss.usermodel.Workbook;
import org.apache.poi.xssf.streaming.SXSSFWorkbook;
import org.apache.poi.xssf.usermodel.XSSFWorkbook;

public class Test08 {
	public static void main(String[] args) {
		//List<String> list= Arrays.asList("AA","BB","CC","DD","EE","FF");
		
		//读取一个已存在的Excel文件
		try (Workbook workbook=new SXSSFWorkbook(1000);
			FileOutputStream out=new FileOutputStream("D:\\demo-data.xlsx")){
			
			//在已经存在的Excel文件中,创建一个新的sheet
			Sheet sheet=workbook.createSheet();
			
			//获取格式编码值
			DataFormat dataformat=workbook.createDataFormat();
			short dateformatCode=dataformat.getFormat("yy年MM月dd日 HH:mm:ss");
			short moneyformatCode=dataformat.getFormat("¥#,###");
			
			//创建日期格式对象
			CellStyle datecellstyle=workbook.createCellStyle();
			datecellstyle.setDataFormat(dateformatCode);
			
			//创建货币格式对象
			CellStyle moneycellstyle=workbook.createCellStyle();
			moneycellstyle.setDataFormat(moneyformatCode);;
			
			//创建列头
			 Row headrow=sheet.createRow(0);
			 Cell headcell0=headrow.createCell(0);
			 headcell0.setCellValue("序号");
			 
			 Cell headcell1=headrow.createCell(1);
			 headcell1.setCellValue("姓名");
			 
			 Cell headcell2=headrow.createCell(2);
			 headcell2.setCellValue("日期");
			 
			 Cell headcell3=headrow.createCell(3);
			 headcell3.setCellValue("红包金额");
			 long begin=System.currentTimeMillis();
			 for(int i=0;i<1000000;i++) {
				 //String name=list.get(i);
				 String name=i+"A";
				 //创建行
				 Row row=sheet.createRow(i+1);
				 
				 //创建单元格
				 Cell cell0=row.createCell(0);//序号
				 cell0.setCellValue(String.valueOf(i+1));
				 
				 Cell cell1=row.createCell(1);//姓名
				 cell1.setCellValue(name);
				 
				 Cell cell2=row.createCell(2);//日期
				 cell2.setCellStyle(datecellstyle);
				 cell2.setCellValue(new Date());
				 
				 Cell cell3=row.createCell(3);//金额
				 cell3.setCellStyle(moneycellstyle);
				 cell3.setCellValue(Math.random()*1000000);
				 
			 }
			 //写入文件
			workbook.write(out);
			long end=System.currentTimeMillis();
			System.out.println("耗时"+(end-begin)+"毫秒");
		} catch (IOException e) {
			
			e.printStackTrace();
		}
	}

}

执行结束后得到使用SXSSFWorkbook的执行时间为:

 使用EasyExcel

在使用EasyExcel前要准备相关的class

首先准备一个实体类(Order类)

package com.hwh.Demo1;

import java.time.LocalDateTime;
import java.time.format.DateTimeFormatter;
import java.util.UUID;

import com.alibaba.excel.annotation.ExcelProperty;
import com.alibaba.excel.annotation.format.NumberFormat;

public class Order {
    @ExcelProperty("订单编号")
	private String orderId; // 订单编号
	
    @ExcelProperty("支付金额")
	@NumberFormat("¥#,###")
	private Double payment; // 支付金额
	
    @ExcelProperty(value = "创建日期",converter = LocalDateTimeConverter.class)
	private LocalDateTime creationTime; // 创建时间

	public Order() {
		this.orderId = LocalDateTime.now().format(DateTimeFormatter.ofPattern("yyyyMMddhhmmss"))
				+ UUID.randomUUID().toString().substring(0, 5);
		this.payment = Math.random() * 10000;
		this.creationTime = LocalDateTime.now();
	}

	public String getOrderId() {
		return orderId;
	}

	public void setOrderId(String orderId) {
		this.orderId = orderId;
	}

	public Double getPayment() {
		return payment;
	}

	public void setPayment(Double payment) {
		this.payment = payment;
	}

	public LocalDateTime getCreationTime() {
		return creationTime;
	}

	public void setCreationTime(LocalDateTime creationTime) {
		this.creationTime = creationTime;
	}



	@Override
	public String toString() {
		return "Order [orderId=" + orderId + ", payment=" + payment + ", creationTime=" + creationTime + "]";
	}
}

其次准备一个转换类(LocalDateTime日期时间转换类)

package com.hwh.Demo1;

import java.time.LocalDateTime;
import java.time.format.DateTimeFormatter;

import com.alibaba.excel.converters.Converter;
import com.alibaba.excel.enums.CellDataTypeEnum;
import com.alibaba.excel.metadata.CellData;
import com.alibaba.excel.metadata.GlobalConfiguration;
import com.alibaba.excel.metadata.property.ExcelContentProperty;

public class LocalDateTimeConverter implements Converter<LocalDateTime> {

	@Override
	public Class<LocalDateTime> supportJavaTypeKey() {
		return LocalDateTime.class;
	}

	@Override
	public CellDataTypeEnum supportExcelTypeKey() {
		return CellDataTypeEnum.STRING;
	}

	@Override
	public LocalDateTime convertToJavaData(CellData cellData, ExcelContentProperty contentProperty,
			GlobalConfiguration globalConfiguration) {
		return LocalDateTime.parse(cellData.getStringValue(), DateTimeFormatter.ofPattern("yyyy-MM-dd HH:mm:ss"));
	}

	@Override
	public CellData<String> convertToExcelData(LocalDateTime value, ExcelContentProperty contentProperty,
			GlobalConfiguration globalConfiguration) {
		return new CellData<>(value.format(DateTimeFormatter.ofPattern("yyyy-MM-dd HH:mm:ss")));
	}

}

最后我们写一个Demo 写入100w条数据

package com.hwh.Demo1;

import java.util.ArrayList;
import java.util.List;

import com.alibaba.excel.EasyExcel;

public class Demo01 {
	public static void main(String[] args) {
        //程序开始的时间
		long begin=System.currentTimeMillis();
       
        //写入100w数据
		EasyExcel.write("D:\\100w.xlsx",Order.class)
		         .sheet("订单编号")
		         .doWrite(data());	
       
        //程序结束时间	
		long end=System.currentTimeMillis();
		System.out.println("耗时"+(end-begin)+"毫秒");
	}
    
    //创建100w条订单数据
	private static List<Order> data(){
		List<Order> list=new ArrayList<Order>();
		for(int i=0;i<1000000;i++) {
			list.add(new Order());
		}
		return list;
		
	}
	

}

执行结束后得到使用EasyExcel的执行时间为:

 小结:

由以上俩组数据对比我们可以了解到,俩种方法读写超大Excel文件的耗时相差不多,但两者在运行时对于CPU的利用率各有不同。

POI

 EasyExcel

由此我们可以知道比起 POI来说使用EasyExcel在性能与内存占用方面更有优势。所以在读写超大Excel文件时,我更推荐使用EasyExcel。

评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值