场景:对于经常需要导入Excel模板或数据来解析后加以应用的,使用频率非常之高,做了一个比较稳定的版本,体现在这些地方
工具:org.apache.poi
使用前必须了解这些:
1、要解析,那肯定先判断是不是Excel
2、xls后缀的Excel,是03版及以前的用HSSFWorkbook类
xlsx后缀的Excel,是07版及以后的用XSSFWorkbook解析
3、getWorkbook这个方法是我自己乱造各种Excel数据不断测试搜索修正得出的结果,
其他的像简单的判断后缀xls还是xlsx来决定用HSSH还是XSSF是不保险的,比如你可能没遇到过org.apache.poi.openxml4j.exceptions.InvalidFormatException这样的异常,
当然这个异常仍然是因为Excel类型导致获取workbook时出错,然而我查到的结果是,Excel最底层是xml实现的,类型问题出在这儿,看异常的描述也可以稍微看出来openxml4j.exceptions
4 、可能出现空行,空的单元格,或者单元格值为空的情况,这些情况,在我的readExcel()方法里都考虑到了,为什么我不用迭代器,或者加强的for each循环?就是因为这些坑爹的空单元格或者空行啊,迭代器内部在取cell单元格对象时跳过这些空的对象,who knows why?我也不知道,反正我测试过,跳过去了,本来5个单元格,一个空的,结果就只得到4个数据,即使用cell.isEmpty()和cell!=null来判断,也没卵用,因为遍历的时候直接跳过去了,都没有判断的机会
5、取单元格数据,这个就比较简单了,判断单元格类型,根据类型做相应的处理取出来,但是我觉得我这个getCellValue()的方法应该有漏洞,先这么用着
下面上代码,简单描述下关键部位
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.io.InputStream;
import java.io.PushbackInputStream;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.Map;
import java.util.List;
import org.apache.poi.POIXMLDocument;
import org.apache.poi.openxml4j.exceptions.InvalidFormatException;
import org.apache.poi.openxml4j.opc.OPCPackage;
import org.apache.poi.poifs.filesystem.POIFSFileSystem;
import org.apache.poi.ss.usermodel.Cell;
import org.apache.poi.ss.usermodel