【Apache POI】Java解析Excel文件并处理合并单元格-粘贴即用

同为牛马,点个赞吧!

一、Excel文件样例

image-20240716153916656

二、工具类源码

import org.apache.poi.ss.usermodel.*;
import org.apache.poi.ss.util.CellRangeAddress;
import org.apache.poi.xssf.usermodel.XSSFWorkbookFactory;
import org.springframework.web.multipart.MultipartFile;

import java.io.IOException;
import java.io.InputStream;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
import java.util.Map;

/**
 * 读取Excel并解析合并单元格,将结果转为Map集合
 */
public class ReadMergeCellExcelUtil {

    /**
     * 读取Excel数据
     *
     * @param file 上传的Excel文件
     * @return 解析后的数据列表
     */
    public static List<Map<String, String>> readExcelToObj(MultipartFile file) {
        List<Map<String, String>> result = new ArrayList<>();
        try (InputStream inputStream = file.getInputStream()) {
            Workbook workbook = XSSFWorkbookFactory.create(inputStream);
            result = readExcel(workbook, 0, 0, 0);
        } catch (IOException e) {
            e.printStackTrace();
        }
        return result;
    }

    /**
     * 读取Excel文件
     *
     * @param workbook      工作簿
     * @param sheetIndex    sheet页下标:从0开始
     * @param startReadLine 开始读取的行:从0开始
     * @param tailLine      去除最后读取的行
     * @return 解析后的数据列表
     */
    private static List<Map<String, String>> readExcel(Workbook workbook, int sheetIndex, int startReadLine, int tailLine) {
        Sheet sheet = workbook.getSheetAt(sheetIndex);
        FormulaEvaluator formulaEvaluator = workbook.getCreationHelper().createFormulaEvaluator();
        List<Map<String, String>> result = new ArrayList<>();
        for (int i = startReadLine; i <= sheet.getLastRowNum() - tailLine; i++) {
            Row row = sheet.getRow(i);
            Map<String, String> rowData = parseRow(sheet, row, formulaEvaluator);
            result.add(rowData);
        }
        return result;
    }

    /**
     * 解析一行数据
     *
     * @param sheet           工作表
     * @param row             行对象
     * @param formulaEvaluator 公式评估器
     * @return 解析后的行数据
     */
    private static Map<String, String> parseRow(Sheet sheet, Row row, FormulaEvaluator formulaEvaluator) {
        Map<String, String> rowData = new HashMap<>();
        if (row != null) {
            int cellIndex = 0;
            for (Cell cell : row) {
                String cellValue = getCellValue(sheet, cell, formulaEvaluator);
                rowData.put("field" + cellIndex, cellValue);
                cellIndex++;
            }
        }
        return rowData;
    }

    /**
     * 获取单元格的值
     *
     * @param sheet           工作表
     * @param cell            单元格
     * @param formulaEvaluator 公式评估器
     * @return 单元格值
     */
    private static String getCellValue(Sheet sheet, Cell cell, FormulaEvaluator formulaEvaluator) {
        if (cell == null) return "";
        return isMergedRegion(sheet, cell.getRowIndex(), cell.getColumnIndex())
                ? getMergedRegionValue(sheet, cell.getRowIndex(), cell.getColumnIndex(), formulaEvaluator)
                : getCellStringValue(cell, formulaEvaluator);
    }

    /**
     * 获取合并单元格的值
     *
     * @param sheet           工作表
     * @param row             行号
     * @param column          列号
     * @param formulaEvaluator 公式评估器
     * @return 合并单元格值
     */
    private static String getMergedRegionValue(Sheet sheet, int row, int column, FormulaEvaluator formulaEvaluator) {
        for (CellRangeAddress range : sheet.getMergedRegions()) {
            if (range.isInRange(row, column)) {
                Row firstRow = sheet.getRow(range.getFirstRow());
                Cell firstCell = firstRow.getCell(range.getFirstColumn());
                return getCellStringValue(firstCell, formulaEvaluator);
            }
        }
        return "";
    }

    /**
     * 判断单元格是否是合并单元格
     *
     * @param sheet  工作表
     * @param row    行下标
     * @param column 列下标
     * @return 是否是合并单元格
     */
    private static boolean isMergedRegion(Sheet sheet, int row, int column) {
        for (CellRangeAddress range : sheet.getMergedRegions()) {
            if (range.isInRange(row, column)) {
                return true;
            }
        }
        return false;
    }

    /**
     * 获取单元格的字符串值
     *
     * @param cell            单元格
     * @param formulaEvaluator 公式评估器
     * @return 单元格字符串值
     */
    private static String getCellStringValue(Cell cell, FormulaEvaluator formulaEvaluator) {
        switch (cell.getCellType()) {
            case STRING:
                return cell.getStringCellValue();
            case BOOLEAN:
                return String.valueOf(cell.getBooleanCellValue());
            case FORMULA:
                return formulaEvaluator.evaluate(cell).formatAsString();
            case NUMERIC:
                return String.valueOf(cell.getNumericCellValue());
            default:
                return "";
        }
    }

}

三、解析结果

image-20240716154343627

以下内容基本为废话,大可直接忽略!

四、工具类详解及使用方法

在日常牛马中,处理Excel文件是一项常见且重要的任务。Excel文件通常包含丰富的结构化数据,其中合并单元格的处理尤为复杂。本文将介绍一个名为ReadMergeCellExcelUtil的Java工具,帮助您轻松读取并解析Excel文件,处理合并单元格,并将结果转化为易于操作的Map集合。通过本文,您将学会如何使用该工具,以及理解其背后的实现原理。


准备工作

在开始之前,我们需要确保项目中添加了必要的依赖。这里我们主要使用Apache POI库来处理Excel文件。

Maven依赖:

<dependency>
    <groupId>org.apache.poi</groupId>
    <artifactId>poi-ooxml</artifactId>
    <version>5.0.0</version>
</dependency>

工具功能概述

ReadMergeCellExcelUtil工具的核心功能是解析Excel文件并处理合并单元格。它可以读取Excel文件,将每个单元格的内容存储到Map集合中,并正确处理合并单元格的值。典型的应用场景包括从Excel中读取配置数据、解析报表数据等。


代码详细解读
1. 读取Excel数据

方法:readExcelToObj

该方法用于读取上传的Excel文件,并将其内容解析为一个包含多个Map的列表。每个Map表示Excel文件中的一行数据。

public static List<Map<String, String>> readExcelToObj(MultipartFile file) {
    List<Map<String, String>> result = new ArrayList<>();
    try (InputStream inputStream = file.getInputStream()) {
        Workbook workbook = XSSFWorkbookFactory.create(inputStream);
        result = readExcel(workbook, 0, 0, 0);
    } catch (IOException e) {
        e.printStackTrace();
    }
    return result;
}

使用try-with-resources确保输入流在使用后正确关闭。

2. 解析Excel文件

方法:readExcel

该方法从工作簿中获取特定工作表,初始化公式评估器,并循环遍历行以解析每一行的数据。

private static List<Map<String, String>> readExcel(Workbook workbook, int sheetIndex, int startReadLine, int tailLine) {
    Sheet sheet = workbook.getSheetAt(sheetIndex);
    FormulaEvaluator formulaEvaluator = workbook.getCreationHelper().createFormulaEvaluator();
    List<Map<String, String>> result = new ArrayList<>();
    for (int i = startReadLine; i <= sheet.getLastRowNum() - tailLine; i++) {
        Row row = sheet.getRow(i);
        Map<String, String> rowData = parseRow(sheet, row, formulaEvaluator);
        result.add(rowData);
    }
    return result;
}
3. 解析一行数据

方法:parseRow

该方法遍历行中的单元格,并将其值存储到Map中。

private static Map<String, String> parseRow(Sheet sheet, Row row, FormulaEvaluator formulaEvaluator) {
    Map<String, String> rowData = new HashMap<>();
    if (row != null) {
        int cellIndex = 0;
        for (Cell cell : row) {
            String cellValue = getCellValue(sheet, cell, formulaEvaluator);
            rowData.put("field" + cellIndex, cellValue);
            cellIndex++;
        }
    }
    return rowData;
}
4. 获取单元格值

方法:getCellValue

该方法根据单元格类型获取其值,并处理合并单元格。

private static String getCellValue(Sheet sheet, Cell cell, FormulaEvaluator formulaEvaluator) {
    if (cell == null) return "";
    return isMergedRegion(sheet, cell.getRowIndex(), cell.getColumnIndex())
            ? getMergedRegionValue(sheet, cell.getRowIndex(), cell.getColumnIndex(), formulaEvaluator)
            : getCellStringValue(cell, formulaEvaluator);
}
5. 获取合并单元格值

方法:getMergedRegionValue

该方法查找并获取合并单元格的值。

private static String getMergedRegionValue(Sheet sheet, int row, int column, FormulaEvaluator formulaEvaluator) {
    for (CellRangeAddress range : sheet.getMergedRegions()) {
        if (range.isInRange(row, column)) {
            Row firstRow = sheet.getRow(range.getFirstRow());
            Cell firstCell = firstRow.getCell(range.getFirstColumn());
            return getCellStringValue(firstCell, formulaEvaluator);
        }
    }
    return "";
}
6. 判断单元格是否是合并单元格

方法:isMergedRegion

该方法检查指定单元格是否属于合并区域。

private static boolean isMergedRegion(Sheet sheet, int row, int column) {
    for (CellRangeAddress range : sheet.getMergedRegions()) {
        if (range.isInRange(row, column)) {
            return true;
        }
    }
    return false;
}
7. 获取单元格的字符串值

方法:getCellStringValue

该方法根据单元格类型获取字符串值,并评估公式单元格。

private static String getCellStringValue(Cell cell, FormulaEvaluator formulaEvaluator) {
    switch (cell.getCellType()) {
        case STRING:
            return cell.getStringCellValue();
        case BOOLEAN:
            return String.valueOf(cell.getBooleanCellValue());
        case FORMULA:
            return formulaEvaluator.evaluate(cell).formatAsString();
        case NUMERIC:
            return String.valueOf(cell.getNumericCellValue());
        default:
            return "";
    }
}

示例代码

以下是一个完整的示例,展示如何使用ReadMergeCellExcelUtil工具读取并解析Excel文件:

import org.springframework.web.multipart.MultipartFile;
import java.util.List;
import java.util.Map;

public class ExcelParserExample {

    public static void main(String[] args) {
        // 假设有一个MultipartFile类型的Excel文件对象file
        MultipartFile file = ...;

        // 使用工具类解析Excel文件
        List<Map<String, String>> parsedData = ReadMergeCellExcelUtil.readExcelToObj(file);

        // 打印解析结果
        for (Map<String, String> rowData : parsedData) {
            System.out.println(rowData);
        }
    }
}

运行结果将是Excel文件的解析数据,每一行数据以Map的形式存储。


常见问题与解决方案
  1. 空单元格处理:确保在解析单元格时处理空单元格,避免空指针异常。
  2. 大型Excel文件处理:对于大型Excel文件,可以考虑使用流式读取方法,以减少内存消耗。

结论

ReadMergeCellExcelUtil工具提供了一种简单而有效的方式来解析Excel文件并处理合并单元格。通过使用Apache POI库,我们可以轻松处理各种复杂的Excel文件格式。未来,可以考虑进一步优化性能,并添加更多功能,如支持多种文件格式和自定义数据解析规则。

Over!

  • 3
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Java解析excel文件,可以使用Apache POI框架来读取和操作Excel文件。具体实现流程如下: 1. 引入Apache POI依赖: ```xml <dependency> <groupId>org.apache.poi</groupId> <artifactId>poi</artifactId> <version>4.1.2</version> </dependency> ``` 2. 创建工作簿对象: ```java Workbook workbook = WorkbookFactory.create(new File("文件路径")); ``` 3. 获取工作表对象: ```java Sheet sheet = workbook.getSheetAt(0); ``` 4. 遍历每一行,并判断是否有合并单元格: ```java for (int i = 0; i <= sheet.getLastRowNum(); i++) { Row row = sheet.getRow(i); if (row == null) { continue; } for (int j = 0; j < row.getLastCellNum(); j++) { Cell cell = row.getCell(j); if (cell == null) { continue; } // 判断是否有合并单元格 if (cell.getCellType() == CellType.STRING && sheet.getMergedRegions().size() > 0) { for (CellRangeAddress range : sheet.getMergedRegions()) { if (range.isInRange(cell.getRowIndex(), cell.getColumnIndex())) { // 输出数据格式错误,不能合并单元格 System.out.println("数据格式错误,第" + (i + 1) + "行第" + (j + 1) + "列不能合并单元格"); break; } } } // 输出单元格数据 System.out.print(cell.toString() + "\t"); } System.out.println(); } ``` 通过遍历每一行和每一列,可以判断每个单元格是否有合并单元格。如果有合并单元格,可以输出数据格式错误提示信息,否则输出单元格数据。 需要注意的是,在使用Apache POI框架解析Excel文件时,需要根据具体的Excel文件格式进行不同的处理。如果文件格式比较复杂,可能需要使用更复杂的方法来解析文件

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值