POI简单使用和大文件写优化

一、 POI简介(Apache POI)

1、什么是POI

Apache POI是Apache软件基金会的开放源码函式库,POI提供API给Java程序对Microsoft Office格式档案读和写的功能。

  • HSSF - 提供读写Microsoft Excel格式档案的功能。(.xls)
  • XSSF - 提供读写Microsoft Excel OOXML格式档案的功能。(.xlsx)
  • HWPF - 提供读写Microsoft Word格式档案的功能。
  • HSLF - 提供读写Microsoft PowerPoint格式档案的功能。
  • HDGF - 提供读写Microsoft Visio格式档案的功能。

2、官网

http://poi.apache.org/
官网可以找到文档和每个版本的下载地址

二、准备

1、创建一个普通的maven项目

主要测试操作Excel,有两种操作方式

  • HSSFWorkbook:是操作Excel2003以前(包括2003)的版本,扩展名是.xls
  • XSSFWorkbook:是操作Excel2007后的版本,扩展名是.xlsx

2、pom中引入xml相关依赖

<dependencies>
    <!--xls(03)-->
    <dependency>
        <groupId>org.apache.poi</groupId>
        <artifactId>poi</artifactId>
        <version>3.9</version>
    </dependency>

    <!--xlsx(07)-->
    <dependency>
        <groupId>org.apache.poi</groupId>
        <artifactId>poi-ooxml</artifactId>
        <version>3.9</version>
    </dependency>
    
    <!--日期格式化工具-->
    <dependency>
        <groupId>joda-time</groupId>
        <artifactId>joda-time</artifactId>
        <version>2.10.1</version>
    </dependency>

    <!--test-->
    <dependency>
        <groupId>junit</groupId>
        <artifactId>junit</artifactId>
        <version>4.12</version>
    </dependency>
</dependencies>

三、HSSF和XSSF写

1、HSSFWorkbook

public class ExcelWriteTest {

	@Test
	public void testWriteHSSF() throws IOException {

		// 创建新的Excel 工作簿
		Workbook workbook = new HSSFWorkbook();

		// 在Excel工作簿中建一工作表,其名为缺省值 Sheet0
		//Sheet sheet = workbook.createSheet();

		// 如要新建一名为"会员登录统计"的工作表,其语句为:
		Sheet sheet = workbook.createSheet("会员登录统计");

		// 创建行(row 1)
		Row row1 = sheet.createRow(0);

		// 创建单元格(col 1-1)
		Cell cell11 = row1.createCell(0);
		cell11.setCellValue("今日人数");

		// 创建单元格(col 1-2)
		Cell cell12 = row1.createCell(1);
		cell12.setCellValue(666);

		// 创建行(row 2)
		Row row2 = sheet.createRow(1);

		// 创建单元格(col 2-1)
		Cell cell21 = row2.createCell(0);
		cell21.setCellValue("统计时间");

		//创建单元格(第三列)
		Cell cell22 = row2.createCell(1);
		String dateTime = new DateTime().toString("yyyy-MM-dd HH:mm:ss");
		cell22.setCellValue(dateTime);

		// 新建一输出文件流(注意:要先创建文件夹)
		FileOutputStream out = new FileOutputStream("/usr/local/poi/testHSSF.xls");
		// 把相应的Excel 工作簿存盘
		workbook.write(out);
		// 操作结束,关闭文件
		out.close();
        
		System.out.println("文件生成成功");
	}
}

2、XSSFWorkbook

@Test
public void testWriteXSSF() throws IOException {

    // 创建新的Excel 工作簿
    Workbook workbook = new XSSFWorkbook();

    ......// 和HSSFWorkbook一样
        
    // 新建一输出文件流(注意:要先创建文件夹)
    FileOutputStream out = new FileOutputStream("/usr/local/poi/testXSSF.xlsx");
    
    ......
}

3、大文件写HSSF、XSSF

1)使用HSSF

缺点:最多只能处理65536行,否则会抛出异常
java.lang.IllegalArgumentException: Invalid row number (65536) outside allowable range (0…65535)
优点:过程中写入缓存,不操作磁盘,最后一次性写入磁盘,速度快

@Test
public void testWrite03BigData() throws IOException {
    //记录开始时间
    long begin = System.currentTimeMillis();

    //创建一个SXSSFWorkbook
    Workbook workbook = new HSSFWorkbook();

    //创建一个sheet
    Sheet sheet = workbook.createSheet();

    //xls文件最大支持65536行
    for (int rowNum = 0; rowNum < 65536; rowNum++) {
        //创建一个行
        Row row = sheet.createRow(rowNum);
        for (int cellNum = 0; cellNum < 10; cellNum++) {//创建单元格
            Cell cell = row.createCell(cellNum);
            cell.setCellValue(cellNum);
        }
    }

    System.out.println("done");
    FileOutputStream out = new FileOutputStream("/usr/local/poi/test-write03-bigdata.xls");
    workbook.write(out);
    // 操作结束,关闭文件
    out.close();

    //记录结束时间
    long end = System.currentTimeMillis();
    System.out.println((double)(end - begin)/1000);
}
2)使用XSSF

缺点:写数据时速度非常慢,非常耗内存,也会发生内存溢出,如100万条
优点:可以写较大的数据量,如20万条

@Test
public void testWrite07BigData() throws IOException {
    //记录开始时间
    long begin = System.currentTimeMillis();

    //创建一个XSSFWorkbook
    Workbook workbook = new XSSFWorkbook();

    ......
        
    FileOutputStream out = new FileOutputStream("/usr/local/poi/test-write07-bigdata.xlsx");
   
    ......
}
3)使用SXSSF

优点:可以写非常大的数据量,如100万条甚至更多条,写数据速度快,占用更少的内存
注意:
过程中会产生临时文件,需要清理临时文件
默认由100条记录被保存在内存中,如果查过这数量,则最前面的数据被写入临时文件
如果想自定义内存中数据的数量,可以使用new SXSSFWorkbook(数量)

@Test
public void testWrite07BigDataFast() throws IOException {
    //记录开始时间
    long begin = System.currentTimeMillis();

    //创建一个SXSSFWorkbook
    Workbook workbook = new SXSSFWorkbook();

   ......

    FileOutputStream out = new FileOutputStream("xlsx");
    workbook.write(out);
    // 操作结束,关闭文件
    out.close();

    //清除临时文件
    ((SXSSFWorkbook)workbook).dispose();

    //记录结束时间
    long end = System.currentTimeMillis();
    System.out.println((double)(end - begin)/1000);
}

四、HSSF和XSSF读

1、HSSF


public class ExcelReadTest {

	@Test
	public void testRead03() throws Exception{

		InputStream is = new FileInputStream("需要读取文件的路径.xls");

		Workbook workbook = new HSSFWorkbook(is);
		Sheet sheet = workbook.getSheetAt(0);

		// 读取第一行第一列
		Row row = sheet.getRow(0);
		Cell cell = row.getCell(0);

		// 输出单元内容
		System.out.println(cell.getStringCellValue());

		// 操作结束,关闭文件
		is.close();
	}
}

2、XSSF

@Test
public void testRead07() throws Exception{

    InputStream is = new FileInputStream("需要读取文件路径.xlsx");

    Workbook workbook = new XSSFWorkbook(is);
    
    ......
}

3、读取不同的数据类型

//判断单元格数据类型
String cellValue = "";
switch (cellType) {
    case HSSFCell.CELL_TYPE_STRING://字符串
        System.out.print("【STRING】");
        cellValue = cell.getStringCellValue();
        break;

    case HSSFCell.CELL_TYPE_BOOLEAN://布尔
        System.out.print("【BOOLEAN】");
        cellValue = String.valueOf(cell.getBooleanCellValue());
        break;

    case HSSFCell.CELL_TYPE_BLANK://空
        System.out.print("【BLANK】");
        break;

    case HSSFCell.CELL_TYPE_NUMERIC:
        System.out.print("【NUMERIC】");
        //cellValue = String.valueOf(cell.getNumericCellValue());

        if (HSSFDateUtil.isCellDateFormatted(cell)) {//日期
            System.out.print("【日期】");
            Date date = cell.getDateCellValue();
            cellValue = new DateTime(date).toString("yyyy-MM-dd");
        } else {
            // 不是日期格式,则防止当数字过长时以科学计数法显示
            System.out.print("【转换成字符串】");
            cell.setCellType(HSSFCell.CELL_TYPE_STRING);
            cellValue = cell.toString();
        }
        break;

    case Cell.CELL_TYPE_ERROR:
        System.out.print("【数据类型错误】");
        break;
}

4、执行Excel计算公式

@Test
public void testFormula() throws Exception{

    InputStream is = new FileInputStream(".xls");

    Workbook workbook = new HSSFWorkbook(is);
    Sheet sheet = workbook.getSheetAt(0);

    // (假设计算公式在五行第一列)读取第五行第一列
    Row row = sheet.getRow(4);
    Cell cell = row.getCell(0);

    //公式计算器
    FormulaEvaluator formulaEvaluator = new HSSFFormulaEvaluator((HSSFWorkbook) workbook);

    // 输出单元内容
    int cellType = cell.getCellType();
    switch (cellType) {
        case Cell.CELL_TYPE_FORMULA://2

            //得到公式
            String formula = cell.getCellFormula();
            System.out.print(formula);

            CellValue evaluate = formulaEvaluator.evaluate(cell);
            //String cellValue = String.valueOf(evaluate.getNumberValue());
            String cellValue = evaluate.formatAsString();
            System.out.println(cellValue);

            break;
    }
}
  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值