Java 学习笔记 - Apache POI 处理 Excel

这篇博客介绍了如何使用 Apache POI 库处理 Excel 文件,包括引入依赖、创建工作薄、遍历工作表、数据行和单元格。通过 WorkbookFactory 工厂方法自动判断 Excel 版本,提供了遍历单元格的示例代码,适用于 Java 开发者处理 Excel 数据。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

简介

组件介绍
HSSF对应 03.xls
XSSF对应 07.xlsx
SXSSF对应 07.xlsx,针对大文件读写做了优化

pom.xml

<!--03 的 .xls-->
<dependency>
    <groupId>org.apache.poi</groupId>
    <artifactId>poi</artifactId>
    <version>5.2.2</version>
</dependency>
<!--07 的 .xlsx-->
<dependency>
    <groupId>org.apache.poi</groupId>
    <artifactId>poi-ooxml</artifactId>
    <version>5.2.2</version>
</dependency>

测试

创建工作薄

拿到个字符串文件路径"E:\\temp\\测试数据.xls",我到底应该创建哪个对象来操作呢?(扩展名可是能手改的)

HSSFWorkbook sheets1 = new HSSFWorkbook();
XSSFWorkbook sheets2 = new XSSFWorkbook();
SXSSFWorkbook sheets3 = new SXSSFWorkbook();

在网上看到很多根据扩展名 xls , xlsx 进行判断的,或者有些手动去读取文件头判断的。其实 WorkbookFactory.java 提供了工厂方法,自动判断文件头,然后创建工作薄对象。直接调用就行了。这里我用的是密码为null的重载。

Workbook workbook = WorkbookFactory.create(new FileInputStream(path));

最终干活的create方法大概如下这样:
(其中用到的 FileMagic 类 除了判断 excel 还支持很多其他格式,有需要可以拿来)

public static Workbook create(InputStream inp, String password) throws IOException, EncryptedDocumentException {
    // 准备检查魔法(如果流 inp 不支持重复消费,则包一层)
    InputStream is = FileMagic.prepareToCheckMagic(inp);
    // 从流中取第一个字节出来。并 reset 流以便后续可以重头读取。
    byte[] emptyFileCheck = new byte[1];
    is.mark(emptyFileCheck.length); // 标记位置和可消费长度(长度受此参数及缓冲区大小影响)
    if (is.read(emptyFileCheck) < emptyFileCheck.length) { // 如果读取到足 1 字节抛锅
        throw new EmptyFileException();
    }
    is.reset(); // 将流重置到上次的标记位置
    // 从流中读取此文件的魔法值(文件类型标识)
    final FileMagic fm = FileMagic.valueOf(is);
    // 如果是 07 版,调用对应 create 创建工作薄对象。
    if (FileMagic.OOXML == fm) {
        return wp(fm, w -> w.create(is));
    }
    // 如果 03 版也不是,抛锅,老子不认识这文件。
    if (FileMagic.OLE2 != fm) {
        throw new IOException("Can't open workbook - unsupported file type: "+fm);
    }
    // 
    POIFSFileSystem poifs = new POIFSFileSystem(is);
    DirectoryNode root = poifs.getRoot();
    // 这个逻辑不懂。总之是某种特殊情况,再判断一次。
    boolean isOOXML = root.hasEntry(DEFAULT_POIFS_ENTRY) || root.hasEntry(OOXML_PACKAGE);
    // 根据结果创建工作薄
    return wp(isOOXML ? FileMagic.OOXML : fm, w -> w.create(root, password));
}

遍历:工作薄》工作表》数据行》单元格

import org.apache.poi.ss.usermodel.*;
import org.junit.jupiter.api.Test;
import java.io.FileInputStream;
import java.util.Iterator;

public class ApachePOITest {
    private String path = "E:\\测试数据表.xlsx";

    @Test
    public void createWorkbook() throws Exception {
        System.out.println(path);
        
        // 通过【path】文件路径拿到【Workbook】工作薄(会自动判断Excel版本)
        Workbook workbook = WorkbookFactory.create(new FileInputStream(path));
        
        // 取出【Sheet 工作表】迭代器
        Iterator<Sheet> sheetIterator = workbook.sheetIterator();
        // 遍历【Sheet 工作表】
        while (sheetIterator.hasNext()) {       
            Sheet sheet = sheetIterator.next();
            // 取出【Row 数据行】迭代器
            Iterator<Row> rowIterator = sheet.rowIterator();
            // 遍历【数据行】
            while(rowIterator.hasNext()) {
                Row row = rowIterator.next();
                // 取出【Cell 单元格】迭代器
                Iterator<Cell> cellIterator = row.cellIterator();
                // 遍历【单元格】
                while (cellIterator.hasNext()) {
                    Cell cell = cellIterator.next();
                    // 取出单元格内容并打印
                    System.out.print(getCellValue(cell) + ";\t\t");
                }
                System.out.println();
            }
        }
    }

    /**
     * 按类型获取单元格值的字符串形式
     * @param cell
     * @return
     */
    private String getCellValue(Cell cell) {
        switch (cell.getCellType()) {
            case BLANK:
                return "空单元格:";
            case FORMULA:
                return "公式:" + cell.getCellFormula();
            case NUMERIC:
                return "数字:" + cell.getNumericCellValue();
            case STRING:
                return "字符串:" + cell.getStringCellValue();
            case BOOLEAN:
                return "布尔值:" + cell.getBooleanCellValue();
            case ERROR:
                return "错误值:" + cell.getErrorCellValue();
            default:
                return "未知类型:" + cell.getCellType();
        }
    }
}

参考资料

文档

Apache POI - Javadocs
Apache POI - Component Overview
Apache POI - Component Overview:HSSF、XSSF快速指南

相关封装

Hutool-poi
悟耘开源 / easypoi
Alibaba Easy Excel

教程

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

笑虾

多情黯叹痴情癫。情癫苦笑多情难

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值