大数据量excel2007导入(大于10M)-java

最新推荐文章于 2024-06-21 09:21:03 发布

置顶

淡蓝青春

最新推荐文章于 2024-06-21 09:21:03 发布

阅读量6.7k

点赞数 2

文章标签： excel import string exception attributes 数据库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wenyi_y/article/details/6180739

版权

本文介绍了如何处理大数据量的Excel2007导入问题，通过使用事件模型EventUserModel（SAX）进行解析，避免内存溢出。文中详细描述了解决方案，包括使用自定义的XxlsAbstract和XxlsBig类，以及多线程将数据写入临时表再导入目标数据库。同时，文章提出了解决空单元格问题的权宜之计，以及在服务层接收文件路径的调整。文章最后分享了处理单个sheet和整个Excel文件的代码片段。

摘要由CSDN通过智能技术生成

最近的项目中碰到这样一个问题，用户需要导入大数据量的数据，要导入的数据文件大于7M,用户在系统使用的高峰期进行导入，结果导致应用服务器的cpu负载过高，其他用户无法使用系统，系统崩溃的情况。

我们之前没有考虑到这么大数据量的导入，我们使用的是poi3.6版本，用的方式是把用户要导入的文件读成流，然后一次性放到poi的WorkBook中，经过测试，当文件的大小大于5M左右，tomcat服务器的内存就会溢出，从而导致服务器崩溃。

为了解决这个问题，我在网上查了一些资料，解决的方式大概如下(此种方式只适用于excel2007)：

1. 采用的读取方式是事件模型eventusermodel，因为excel2007采用的存储方式实际上是xml形式，excel2007可以用系统自带的解压缩软件解压之后可以看到数据都是存储成xml格式的数据，所以这里采用sax的方式对excel文件进行解析。

2. 我在网上下载了2个类文件

抽象类：XxlsAbstract ，作用：遍历excel文件，提供行级操作方法 optRows

继承类：XxlsBig，作用：将数据转出到数据库临时表 temp_table

另外，还需要一个属性文件 db.properties，把数据库的链接写到属性文件中。

3. 另外我自己写了一个多线程的程序，把临时表 temp_table 的数据再写到真正需要导入的数据库表中

4. 写完数据把临时表删除。

程序经过测试，50M左右的文件在本地进行导入都比较稳定。

但是有几个问题不知道怎么办？

1. excel2007文件转换成xml格式的文件之后，可以看到，如果某一行的某个单元格没有内容，xml中就不显示这个单元格，也就是说此种方式不能处理空的单元格。

解决方案：我自己是这么处理的，在导入之前，先把左右的空单元格统一替换成1，然后在java后台在把1替换回来，这样做肯定很影响导入的性能，但是暂时只想到这么个办法。

2. 之前的导入传到service层的是一个文件流，现在XxlsBig类中接收的参数仅仅是一个文件路径，所以如果我的程序发布到应用服务器上，肯定是拿不到要导入的文件的。

总之，还有一些细节的问题弄不明白，需要csdn的兄弟姐妹们给予指导，谢谢啦~~

2011年2月22日补充：

在javaeye上看到了原创作者的补充，解决了问题1，

代码如下：

package com.gaosheng.util.xls;

import java.io.InputStream;
import java.sql.SQLException;
import java.util.ArrayList;
import java.util.Iterator;

最低0.47元/天解锁文章

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

淡蓝青春 CSDN认证博客专家 CSDN认证企业博客

码龄15年

1: 原创

157万+: 周排名

142万+: 总排名

6794: 访问

: 等级

90: 积分

11: 粉丝

2: 获赞

2: 评论

1: 收藏

私信

关注

热门文章

大数据量excel2007导入(大于10M)-java 6795

最新评论

大数据量excel2007导入(大于10M)-java
clive1191191: 但是这种方式比一次性读到内存中的慢很多慢了4倍左右， 14万数据（只有一列），直接读到内存的方式，只要6s sax这种方式需要27s 这个不知道你们有解决过
大数据量excel2007导入(大于10M)-java
YECHWNG: XxlsBig的类读取数据好像有点问题，当excel文件没有保存就不能读取，不知道楼主是怎么解决的

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。