packageshindo.Java;importjava.io.FileInputStream;importjava.io.InputStream;importjava.util.ArrayList;importjava.util.List;importorg.apache.poi.hssf.usermodel.HSSFCell;importorg.apache.poi.hssf.usermodel.HSSFRow;importorg.apache.poi.hssf.usermodel.HSSFSheet;importorg.apache.poi.hssf.usermodel.HSSFWorkbook;importorg.apache.poi.ss.usermodel.Cell;importorg.apache.poi.xssf.usermodel.XSSFCell;importorg.apache.poi.xssf.usermodel.XSSFRow;importorg.apache.poi.xssf.usermodel.XSSFSheet;importorg.apache.poi.xssf.usermodel.XSSFWorkbook;public classExcelUtil {public static voidmain(String[] args) {
String path= "D:\\IDE\\workspace-Neon\\Java\\src\\refund.xls";try{
List> result = newExcelUtil().readXls(path);
System.out.println(result.size());for (int i = 0; i < result.size(); i++) {
List model =result.get(i);
System.out.println("orderNum:" + model.get(0) + "--> orderAmount:" + model.get(1));
}
}catch(Exception e) {
e.printStackTrace();
}
}/***
* @Title: readXls
* @Description: 处理xls文件
*@param @parampath
*@param @return*@param @throwsException 设定文件
*@returnList> 返回类型
*@throws*
* 从代码不难发现其处理逻辑:
* 1.先用InputStream获取excel文件的io流
* 2.然后穿件一个内存中的excel文件HSSFWorkbook类型对象,这个对象表示了整个excel文件。
* 3.对这个excel文件的每页做循环处理
* 4.对每页中每行做循环处理
* 5.对每行中的每个单元格做处理,获取这个单元格的值
* 6.把这行的结果添加到一个List数组中
* 7.把每行的结果添加到最后的总结果中
* 8.解析完以后就获取了一个List>类型的对象了
**/
private List> readXls(String path) throwsException {
InputStream is= newFileInputStream(path);//HSSFWorkbook 标识整个excel
HSSFWorkbook hssfWorkbook = newHSSFWorkbook(is);
List> result = new ArrayList>();int size =hssfWorkbook.getNumberOfSheets();//循环每一页,并处理当前循环页
for (int numSheet = 0; numSheet < size; numSheet++) {//HSSFSheet 标识某一页
HSSFSheet hssfSheet =hssfWorkbook.getSheetAt(numSheet);if (hssfSheet == null) {continue;
}//处理当前页,循环读取每一行
for (int rowNum = 1; rowNum <= hssfSheet.getLastRowNum(); rowNum++) {//HSSFRow表示行
HSSFRow hssfRow =hssfSheet.getRow(rowNum);int minColIx =hssfRow.getFirstCellNum();int maxColIx =hssfRow.getLastCellNum();
List rowList = new ArrayList();//遍历改行,获取处理每个cell元素
for (int colIx = minColIx; colIx < maxColIx; colIx++) {//HSSFCell 表示单元格
HSSFCell cell =hssfRow.getCell(colIx);if (cell == null) {continue;
}
rowList.add(getStringVal(cell));
}
result.add(rowList);
}
}returnresult;
}/***
* @Title: readXlsx
* @Description: 处理Xlsx文件
*@param @parampath
*@param @return*@param @throwsException 设定文件
*@returnList> 返回类型
*@throws
*/
private List> readXlsx(String path) throwsException {
InputStream is= newFileInputStream(path);
XSSFWorkbook xssfWorkbook= newXSSFWorkbook(is);
List> result = new ArrayList>();//循环每一页,并处理当前循环页
for(XSSFSheet xssfSheet : xssfWorkbook) {if (xssfSheet == null) {continue;
}//处理当前页,循环读取每一行
for (int rowNum = 1; rowNum <= xssfSheet.getLastRowNum(); rowNum++) {
XSSFRow xssfRow=xssfSheet.getRow(rowNum);int minColIx =xssfRow.getFirstCellNum();int maxColIx =xssfRow.getLastCellNum();
List rowList = new ArrayList();for (int colIx = minColIx; colIx < maxColIx; colIx++) {
XSSFCell cell=xssfRow.getCell(colIx);if (cell == null) {continue;
}
rowList.add(cell.toString());
}
result.add(rowList);
}
}returnresult;
}//存在的问题
/** 其实有时候我们希望得到的数据就是excel中的数据,可是最后发现结果不理想
* 如果你的excel中的数据是数字,你会发现Java中对应的变成了科学计数法。
* 所以在获取值的时候就要做一些特殊处理来保证得到自己想要的结果
* 网上的做法是对于数值型的数据格式化,获取自己想要的结果。
* 下面提供另外一种方法,在此之前,我们先看一下poi中对于toString()方法:
*
* 该方法是poi的方法,从源码中我们可以发现,该处理流程是:
* 1.获取单元格的类型
* 2.根据类型格式化数据并输出。这样就产生了很多不是我们想要的
* 故对这个方法做一个改造。*/
/*public String toString(){
switch(getCellType()){
case CELL_TYPE_BLANK:
return "";
case CELL_TYPE_BOOLEAN:
return getBooleanCellValue() ? "TRUE" : "FALSE";
case CELL_TYPE_ERROR:
return ErrorEval.getText(getErrorCellValue());
case CELL_TYPE_FORMULA:
return getCellFormula();
case CELL_TYPE_NUMERIC:
if(DateUtil.isCellDateFormatted(this)){
DateFormat sdf = new SimpleDateFormat("dd-MMM-yyyy")
return sdf.format(getDateCellValue());
}
return getNumericCellValue() + "";
case CELL_TYPE_STRING:
return getRichStringCellValue().toString();
default :
return "Unknown Cell Type:" + getCellType();
}
}*/
/*** 改造poi默认的toString()方法如下
* @Title: getStringVal
* @Description: 1.对于不熟悉的类型,或者为空则返回""控制串
* 2.如果是数字,则修改单元格类型为String,然后返回String,这样就保证数字不被格式化了
*@param @paramcell
*@param @return设定文件
*@returnString 返回类型
*@throws
*/
public staticString getStringVal(HSSFCell cell) {switch(cell.getCellType()) {caseCell.CELL_TYPE_BOOLEAN:return cell.getBooleanCellValue() ? "TRUE" : "FALSE";caseCell.CELL_TYPE_FORMULA:returncell.getCellFormula();caseCell.CELL_TYPE_NUMERIC:
cell.setCellType(Cell.CELL_TYPE_STRING);returncell.getStringCellValue();caseCell.CELL_TYPE_STRING:returncell.getStringCellValue();default:return "";
}
}
}