Java解析Excel文件

背景

在低代码产品的研发过程中,为用户提供数据导入导出的能力时,无法避免的就是对EXCEL解析的能力,所以本篇通过介绍部分开源框架以及收费框架的相关技术,来介绍低代码产品中与Excel解析相关的知识。

技术选型

开源Java框架选型

在Java中,解析Excel文件的技术选择多种多样,但最为流行和广泛使用的莫过于Apache POI和EasyExcel。

1. Apache POI

Apache POI是Apache软件基金会下的一个开源项目,提供了对Microsoft Office格式文件的读写支持,包括Excel、Word和PowerPoint等。对于Excel文件,Apache POI支持.xls(Excel 2003及之前版本)和.xlsx(Excel 2007及之后版本)两种格式。

Apache POI基于DOM(Document Object Model)方式解析Excel文件,即将整个文件加载到内存中,然后构建成一个树状结构,便于通过编程方式访问和操作。这种方式在处理小型Excel文件时非常高效,但如果文件过大,可能会导致内存溢出。

代码示例:

import org.apache.poi.ss.usermodel.*;
import org.apache.poi.xssf.usermodel.XSSFWorkbook;
 
import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
 
public class ExcelParser {
    public static void main(String[] args) {
        String excelFilePath = "path/to/your/excel/file.xlsx";
        try (FileInputStream fileInputStream = new FileInputStream(new File(excelFilePath));
             Workbook workbook = new XSSFWorkbook(fileInputStream)) {
            Sheet sheet = workbook.getSheetAt(0); // 获取第一个工作表
            for (Row row : sheet) { // 迭代行
                for (Cell cell : row) { // 迭代列
                    // 获取单元格数据,根据单元格类型使用相应的方法
                    switch (cell.getCellTypeEnum()) {
                        case STRING:
                            System.out.print(cell.getStringCellValue() + "\t");
                            break;
                        case NUMERIC:
                            System.out.print(cell.getNumericCellValue() + "\t");
                            break;
                        case BOOLEAN:
                            System.out.print(cell.getBooleanCellValue() + "\t");
                            break;
                        case FORMULA:
                            System.out.print(cell.getCellFormula() + "\t");
                            break;
                        default:
                            System.out.print("\t");
                            break;
                    }
                }
                System.out.println();
            }
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

2. EasyExcel

EasyExcel是阿里巴巴开源的一个基于Java的快速、简洁、解决大文件内存溢出的Excel处理工具。与Apache POI不同,EasyExcel采用了SAX(Simple API for XML)模式来解析Excel文件,实现了逐行读取,大大减少了内存的占用。

EasyExcel特别适用于处理大数据量的Excel文件,能够显著提高处理速度和降低内存消耗。同时,EasyExcel还提供了丰富的API来简化Excel的读写操作,使得开发者能够更加专注于业务逻辑的实现。

import com.alibaba.excel.EasyExcel;
 
public class TestEasyExcel {
    public static void main(String[] args) {
        String fileName = "test.xlsx";
        EasyExcel.write(fileName, Object.class)
                .sheet("Sheet1")
                .doWrite(data());
    }
 
    private static List<Object> data() {
        List<Object> list = new ArrayList<>();
        list.add(new YourDataClass("data1", "data2"));
        // ... 添加更多数据
        return list;
    }
}

收费Java框架选型

1. Spire.XLS for java

Spire.XLS是成都冰蓝科技有限公司为.NET开发人员提供的一款功能强大的Excel操作组件。它以其独立性、广泛的支持性和高效的操作性能,赢得了众多开发者的青睐。无论是在企业级的报表生成、数据分析还是其他需要处理Excel文件的场景中,Spire.XLS for .NET都能为开发者提供强有力的支持。

使用Spire.XLS对于文件类型的转换提供了几行代码即可解析excel甚至将其在离线linux环境中解析甚至转换低版本excel的能力。这在开源框架中是几乎无法完美做到的。

import com.spire.xls.*;
 
public class ParseExcel {
    public static void main(String[] args) {
        //加载Excel文档
        Workbook workbook = new Workbook();
        workbook.loadFromFile("路径到Excel文件.xlsx");
 
        //获取工作表
        Worksheet worksheet = workbook.getWorksheets().get(0);
 
        //遍历工作表中的所有单元格
        for (int i = 0; i < worksheet.getLastRow(); i++) {
            for (int j = 0; j < worksheet.getLastColumn(); j++) {
                //获取单元格并打印值
                Cell cell = worksheet.getCellRange(i, j);
                Object value = cell.getValue();
                System.out.print(value + "\t");
            }
            System.out.println();
        }
    }
}

2. Aspose

Aspose于2002年3月在澳大利亚悉尼创建,与Spire框架类似是一个更加成熟的以及老牌的收费java框架,Aspose以其强大的文件转换能力、丰富的文档处理功能、灵活的图像处理选项以及便捷的邮件处理功能,在多个领域得到了广泛应用。无论是需要处理复杂文档的企业,还是希望实现数据整合和自动化的开发者,Aspose都是一个值得考虑的选择。当然因为他是一个国外的收费软件,所以如果使用其来支撑产品功能性价比会很低。但是他也是少数可以做到在离线的linux环境中解析xls以及doc以及转换的能力。

import com.aspose.cells.Workbook;
import com.aspose.cells.Worksheet;
import com.aspose.cells.Cell;
 
public class ParseExcel {
    public static void main(String[] args) {
        // 加载 Excel 文件
        Workbook workbook = new Workbook("path/to/your/excel/file.xlsx");
 
        // 获取第一个工作表
        Worksheet worksheet = workbook.getWorksheets().get(0);
 
        // 遍历工作表中的所有行和列
        for (int row = 0; row < worksheet.getCells().getMaxRow(); row++) {
            for (int column = 0; column < worksheet.getCells().getMaxColumn(); column++) {
                // 获取单元格
                Cell cell = worksheet.getCells().get(row, column);
 
                // 读取单元格内容
                System.out.print(cell.getStringValue() + "\t");
            }
            System.out.println();
        }
    }
}

总结

在一个成熟的java产品中,如果需要手撸一个解析excel的功能其实有诸多的限制,因为服务器需要部署在linux中,导致无法调用windows自带的一些类库来实现office文件的转换以及修改编辑。而大部分开源的框架中又无法对低版本的excel进行很好的支持,往往需要大量编码时间来做到支撑,并且会经常出现BUG。所以如果遇到这种卡点时,可以考虑使用部分收费的框架来达到这方面的效果。如果是仅支持excel高版本的解析大部分的开源框架都能支持这部分功能。

效率优先

解析低版本excel

需要转换到其他格式

开源

Apache POI

推荐sxssf

不推荐

不推荐

EasyExcel

推荐

较推荐

不推荐

Spire.XLS for java

推荐

推荐

推荐

Aspose

推荐

推荐

推荐

最后附上七巧的资料参考:https://qiqiao.do1.com.cn/


点击关注,更多内容下期继续分享!

Java中,可以使用Apache POI库来解析Excel文件。Apache POI是一个开源的Java库,提供了读取、写入和操作Microsoft Office格式文件(如Excel、Word和PowerPoint)的功能。 要解析Excel文件,首先需要导入Apache POI库的相关依赖。可以在项目的pom.xml文件中添加以下依赖: ```xml <dependency> <groupId>org.apache.poi</groupId> <artifactId>poi</artifactId> <version>4.1.2</version> </dependency> <dependency> <groupId>org.apache.poi</groupId> <artifactId>poi-ooxml</artifactId> <version>4.1.2</version> </dependency> ``` 接下来,可以使用以下代码示例来解析Excel文件: ```java import org.apache.poi.ss.usermodel.*; import org.apache.poi.xssf.usermodel.XSSFWorkbook; import java.io.FileInputStream; import java.io.IOException; public class ExcelParser { public static void main(String[] args) { try { FileInputStream file = new FileInputStream("path/to/excel/file.xlsx"); Workbook workbook = new XSSFWorkbook(file); Sheet sheet = workbook.getSheetAt(0); for (Row row : sheet) { for (Cell cell : row) { CellType cellType = cell.getCellType(); if (cellType == CellType.STRING) { System.out.print(cell.getStringCellValue() + "\t"); } else if (cellType == CellType.NUMERIC) { System.out.print(cell.getNumericCellValue() + "\t"); } else if (cellType == CellType.BOOLEAN) { System.out.print(cell.getBooleanCellValue() + "\t"); } } System.out.println(); } workbook.close(); file.close(); } catch (IOException e) { e.printStackTrace(); } } } ``` 上述代码使用FileInputStream来读取Excel文件,然后创建XSSFWorkbook对象表示整个Excel文件。通过getSheetAt方法获取第一个Sheet,然后使用两个嵌套的循环遍历每一行和每一个单元格。根据单元格的类型,可以使用getCellType方法获取单元格的值。 请注意,上述代码示例假设Excel文件的第一个Sheet是要解析的目标。如果需要解析其他Sheet,可以使用getSheet方法指定Sheet的名称或索引。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

道一云黑板报

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值