1.描述
采用java将excel文件中的特定数据解析出来,然后将数据写文文件或导入数据库。
常用的excel的数据有两种,一种是前几行有数据说明,另一种是全部为数据。需求可能是只要某几行或几列的数据。
如下:
第一种:前几行有数据说明,往往作为插入的字段
第二种:全部为数据
2.引入依赖jar包配置
org.apache.poi
poi-ooxml
3.17
org.apache.poi
poi
3.17
一个excel从程序层面来说,主要有四个属性,Workbook(工作表),Sheet(表单),Row(行), Cell(单元格)。思路是获取工作表,工作表只有一个,但Sheet表单往往可能存在多个,可循环获取表单;然后对每个表单的行进行解析,再解析每行的单元格;单元格中的内容又可分为多种:日期、数字、字符串、boolean类型值、公式、空值、非法字符等,都需要单独处理。
首先初始Workbook,获取该对象,通过该对象循环获取Sheet表单对象,若Sheet只有一页,直接通过workbook.getSheetAt(0);获取。或者通过Sheet的名称获取:workbook.getSheet(“营业厅信息”);获得Sheet对象后,通过sheet.getRow(rowNum);获取行的对象,拿到行的对象后,通过row.getCell(i)获取该行的某个单元格的对象,通过单元格的对象获取内容。
解析出来的数据可以写入txt文件,写成sql、csv等格式的数据,或者写入数据库。
3.下面是代码实现:
ParseExcelPubUtils.java
packagecn.hxc.myExecel;importjava.io.File;importjava.io.FileInputStream;importjava.io.FileNotFoundException;importjava.io.IOException;importjava.text.SimpleDateFormat;importjava.util.HashMap;importjava.util.LinkedList;importjava.util.List;importjava.util.Map;importorg.apache.poi.hssf.usermodel.HSSFWorkbook;importorg.apache.poi.ss.usermodel.Cell;importorg.apache.poi.ss.usermodel.CellType;importorg.apache.poi.ss.usermodel.DateUtil;importorg.apache.poi.ss.usermodel.Row;importorg.apache.poi.ss.usermodel.Sheet;importorg.apache.poi.ss.usermodel.Workbook;importorg.apache.poi.xssf.usermodel.XSSFWorkbook;/*** @Description 按照Workbook,Sheet,Row,Cell一层一层往下读取。
*@authorsun_flower
* 2020年2月28日 下午2:42:28*/
public classParseExcelPubUtils {/*** 判断sheet是否为空
*@paramsheet
*@return* 2020年2月28日 下午4:50:22*/
public static booleanisSheetEmpty(Sheet sheet) {if(sheet.getLastRowNum() == 0 && sheet.getPhysicalNumberOfRows() == 0) {//sheet.getPhysicalNumberOfRows():返回物理定义的行数
System.err.println("该sheet为空,一行数据也没有");return true;
}return false;
}/*** 解析Excel的单元格的内容
*@paramcell 单元格
*@return* 2020年2月28日 下午3:01:20*/
public staticString parseCell(Cell cell) {
CellType cellType=cell.getCellTypeEnum();switch(cellType) {case STRING://字符串
returncell.getStringCellValue();case NUMERIC: //数字、日期 数字类型 先将其cell格式设置成String读取,避免将数字1变成1.0的情况
if(DateUtil.isCellDateFormatted(cell)) {
SimpleDateFormat fmt= new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");return fmt.format(cell.getDateCellValue()); //日期型
} else{
//cell.setCellType(CellType.STRING);//读取数字:cell.getNumericCellValue()
//String cellValue =String.valueOf(cell.getStringCellValue());
double numericCellValue = cell.getNumericCellValue();
String cellValue = String.valueOf(numericCellValue);
if (cellValue.contains("E")) {
return String.valueOf(new Double(cell.getNumericCellValue()).longValue()); // 数字
}
if(cellValue.endsWith(".0")) {
cellValue = cellValue.substring(0, cellValue.length() - 2);
}
returncellValue;
}case BOOLEAN://Boolean
returnString.valueOf(cell.getBooleanCellValue());case FORMULA: //公式
returncell.getCellFormula();case BLANK: //空值
return "";case ERROR://故障
return String.valueOf("非法字符:" +cell.getErrorCellValue());default:return "未知类型";
}
}/*** 默认获取第1个的Sheet
*@paramworkbook
*@paramsheetName sheet的名称
*@return* 2020年2月28日 下午3:02:11*/
public staticSheet getSheet(Workbook workbook) {return getSheet(workbook, 0);
}/*** 根据sheet的名称获取Sheet
*@paramworkbook
*@paramsheetName sheet的名称
*@return* 2020年2月28日 下午3:02:11*/
public staticSheet getSheet(Workbook workbook, String sheetName) {returnworkbook.getSheet(sheetName);
}/*** 获取第几个的Sheet
*@paramworkbook
*@paramsheetIndex sheet所在的index
*@return* 2020年2月28日 下午3:02:37*/
public static Sheet getSheet(Workbook workbook, intsheetIndex) {returnworkbook.getSheetAt(sheetIndex);
}/*** 从文件中获取Workbook解析对象
*@paramfilePath
*@return* 2020年2月28日 下午3:03:23*/
public staticWorkbook readWorkBookeType(String filePath) {
FileInputStream is= null;try{
is= newFileInputStream(filePath);if(filePath.toLowerCase().endsWith(".xlsx")) {//新版excel 2007以上
return newXSSFWorkbook(is);
}else if(filePath.toLowerCase().endsWith(".xls")) {//旧版excel 2003
return newHSSFWorkbook(is);
}else{throw new RuntimeException("excel格式文件错误");
}
}catch(FileNotFoundException e) {
e.printStackTrace();throw new RuntimeException("读取文件错误 == " +e.toString());
}catch(IOException e) {
e.printStackTrace();throw new RuntimeException(&#