java读取大量excel文件

如果excel里面的数据量太多,内存溢出,容易卡死,用下面的工具
引入依赖包

<!-- 读取大量excel数据时使用-->
    <dependency>
      <groupId>com.monitorjbl</groupId>
      <artifactId>xlsx-streamer</artifactId>
      //如果这个版本是2.1.0的,下面两个就选4.0.1的。如果这个是1.2.0的 下面2个就选择3.15版本的
<!--      <version>2.1.0</version>-->
      <version>1.2.0</version>
    </dependency>

    <dependency>
      <groupId>org.apache.poi</groupId>
      <artifactId>poi-ooxml</artifactId>
<!--      <version>4.0.1</version>-->
      <version>3.15</version>
    </dependency>

    <dependency>
      <groupId>org.apache.poi</groupId>
      <artifactId>poi-ooxml-schemas</artifactId>
<!--      <version>4.0.1</version>-->
      <version>3.15</version>
    </dependency>

//这个可能会报错,找不到依赖的时候,引入这个
    <dependency>
      <groupId>xml-apis</groupId>
      <artifactId>xml-apis</artifactId>
      <version>1.4.01</version>
    </dependency>


String fileName = "d:/opt/测试.xlsx";
                FileInputStream in = new FileInputStream(fileName);
                Workbook wk = StreamingReader.builder()
                        //缓存到内存中的行数
                        .rowCacheSize(1000)
                        //读取资源时,缓存到内存的字节大小
                        .bufferSize(8192)
                        .open(in);

                Sheet sheet = wk.getSheetAt(0);
                List<ReportFileDTO> listFile = new ArrayList<>();
                for (Row row : sheet) {
                    //第0行表头跳过
                    int rowNum = row.getRowNum();
                    if (0 == rowNum) {
                        //判断模板是否标准 包含关键字段
                        if (!ExcelUtil.getStringValue(row.getCell(0)).contains("记录") ||
                                !ExcelUtil.getStringValue(row.getCell(1)).contains("时间") ||
                                !ExcelUtil.getStringValue(row.getCell(2)).contains("案件号") ||
                                !ExcelUtil.getStringValue(row.getCell(3)).contains("客户号") ||
                                !ExcelUtil.getStringValue(row.getCell(4)).contains("对象") ||
                                !ExcelUtil.getStringValue(row.getCell(5)).contains("关系") ||
                                !ExcelUtil.getStringValue(row.getCell(6)).contains("号码")) {
                            logger.info("模板不标准:{},fileName:{},{},{},{},{},{},{},{}", trackId, fileName, ExcelUtil.getStringValue(row.getCell(0)),
                                    ExcelUtil.getStringValue(row.getCell(1)), ExcelUtil.getStringValue(row.getCell(2)), ExcelUtil.getStringValue(row.getCell(3)), ExcelUtil.getStringValue(row.getCell(4)), ExcelUtil.getStringValue(row.getCell(5)), ExcelUtil.getStringValue(row.getCell(6)));
                            break;
                        }
                        continue;
                    }

                    ReportFileDTO db = new ReportFileDTO();
                    db.setEventHistoriesId(UUID.randomUUID().toString().replaceAll("-", ""));
                    db.setCallId(ExcelUtil.getStringValue(row.getCell(0)));
                    //时间 年-月-日 时:分:秒
                    try {
                        //yyyy-MM-dd HH:mm:ss
                        Date date = kz.greetgo.gcoll.common.utils.DateUtil.parseYYYY_MM_dd_HHmmss(ExcelUtil.getStringValue(row.getCell(1)));
                        db.setInsertTime(date);
                        db.setFollowDate(date);
                    } catch (Exception e) {
                        try {
                            //yyyy/MM/dd HH:mm:ss
                            Date date = kz.greetgo.gcoll.common.utils.DateUtil.parseYYYYMMDD_HHmmss(ExcelUtil.getStringValue(row.getCell(1)));
                            db.setInsertTime(date);
                            db.setFollowDate(date);
                        } catch (Exception ex) {
                            //时间格式
                            Cell cell = row.getCell(1);
                            Date dateCellValue = cell.getDateCellValue();
                            db.setInsertTime(dateCellValue);
                            db.setFollowDate(dateCellValue);
                        }
                    }
                    //导入时间
                    String year = businessDate.substring(0, 4);
                    String month = businessDate.substring(4, 6);
                    String ymd = year + "-" + month + "-01" + " 00:00:00";
                    db.setImportDate(kz.greetgo.gcoll.common.utils.DateUtil.parseYYYY_MM_dd_HHmmss(ymd));
                    db.setCustomerCode(ExcelUtil.getStringValue(row.getCell(2)));
                    db.setCustomerNo(ExcelUtil.getStringValue(row.getCell(3)));
                    //联系对象(姓名)
                    db.setContactName(ExcelUtil.getStringValue(row.getCell(4)));
                    String stringValue = ExcelUtil.getStringValue(row.getCell(5));
                    db.setIsSelf(stringValue.contains("本人") ? "Y" : "N");
                    //联络号码
                    db.setContactNumber(ExcelUtil.getStringValue(row.getCell(6)));
                    db.setRemark(ExcelUtil.getStringValue(row.getCell(7)));
                    db.setCollectionUnit(ftpTemplateVO.getCode());
                    //导入批次 机构号+businessDate(202405)
                    db.setBatchNo(ftpTemplateVO.getCode() + businessDate);
                    //导入者 system
                    db.setImportPerson("system");
                    //操作类型
                    db.setActionCode("manualCall");
                    //区分数据来源, 1:历史数据,2:委外机构
                    db.setSourceType("2");

                    listFile.add(db);
                }

                //分批入库
                if (listFile.size() > 0) {
                    logger.info("机构号code:{},size:{},trackId:{}", ftpTemplateVO.getCode(), listFile.size(), trackId);
                    //分批入库 Lists.partition(listFile, 300); 每次入300条数据
                    List<List<ReportFileDTO>> partition = Lists.partition(listFile, 300);
                    for (int i = 0; i < partition.size(); i++) {
                        List<ReportFileDTO> list = partition.get(i);
                        reportRegister.get().batchSaveEventHistoryData(list);
                    }
                }
            }


   /**
     * 获取单元格的值的字符串
     *
     * @param cell 单元格对象
     * @return cell单元格的值的字符串
     */
    public static String getStringValue(org.apache.poi.ss.usermodel.Cell cell) {
        if (cell == null) {
            return null;
        }
        CellType cellType = CellType.forInt(cell.getCellType());
        switch (cellType) {
            case STRING:
                return cell.getStringCellValue();
            case NUMERIC:
                double value = cell.getNumericCellValue();
                return String.valueOf(Math.round(value));
            case BOOLEAN:
                return String.valueOf(cell.getBooleanCellValue());
            default:
                return null;
        }
    }
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
Java读取Excel文件时,有可能会遇到内存溢出的问题。导致内存溢出的原因主要有以下几个方面: 1. Excel文件过大:如果Excel文件非常大,包含大量的数据和工作表,读取整个文件可能会消耗大量的内存。尤其是使用HSSF或XSSF类库来处理大型Excel文件时,会将整个Excel文件加载到内存中,容易导致内存溢出。 2. 数据处理不当:在读取Excel文件时,如果没有合理的处理数据,比如对读取的每一行进行逐行处理,将数据存储到合适的数据结构中,可能会导致大量数据同时存在内存中,从而引发内存溢出。 3. 不适当地使用对象:在读取Excel时,可能需要使用大量的对象来存储表格、工作表、单元格等信息。如果使用不当,比如没有及时释放对象,或者创建了过多的对象,都会增加内存的占用,并有可能导致内存溢出。 为解决内存溢出的问题,可以采取以下措施: 1. 分块读取:可以将Excel文件按照一定的规则进行分块读取,每次只读取一部分数据,处理完后释放内存。这样可以降低内存占用,减少内存溢出的风险。 2. 使用流式处理:可以使用Apache POI提供的SXSSFWorkbook类库,通过流式处理方式来读取大型Excel文件。它将Excel文件划分为多个窗格,并在内存中保持一定数量的数据,可以有效地降低内存占用。 3. 及时释放资源:在读取Excel文件时,要注意及时释放不再使用的对象和资源,比如关闭工作表、关闭输入流等。这样可以避免内存泄漏和过度占用内存的情况。 综上所述,Java读取Excel文件内存溢出问题可以通过合理分块读取、流式处理和及时释放资源等方式来解决。需要根据具体的情况选择合适的处理方法,以确保程序在读取Excel文件时不会发生内存溢出。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值