apache poi是解析ms office的比较好用的工具,可以解析excel,word,ppt,visio。我这里讲一个解析excel的比较粗糙的例子
我使用的是apache poi 3.10
引入以下jar包:
poi-3.10-FINAL-20140208.jar
poi-ooxml-3.10-FINAL-20140208.jar
poi-ooxml-schemas-3.10-FINAL-20140208.jar
dom4j-1.6.1.jar
xmlbeans-2.3.0.jar
由于我只用到其中一部分,没必要引用多余的jar包,请根据自己的需求引用
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
|
package
com.zhou.test;
import
java.io.FileInputStream;
import
java.io.FileNotFoundException;
import
java.io.IOException;
import
org.apache.poi.hssf.usermodel.HSSFCell;
import
org.apache.poi.hssf.usermodel.HSSFRow;
import
org.apache.poi.hssf.usermodel.HSSFSheet;
import
org.apache.poi.hssf.usermodel.HSSFWorkbook;
public
class
ReadXls {
public
static
void
main(String args[])
throws
FileNotFoundException, IOException {
//路径
String fileToBeRead =
"E:\\aaa.xls"
;
// 创建对Excel工作簿文件的引用
HSSFWorkbook workbook =
new
HSSFWorkbook(
new
FileInputStream(
fileToBeRead));
// 创建对工作表的引用。
// 本例是按名引用(让我们假定那张表有着缺省名"Sheet1")
// 也可用getSheetAt(int index)按索引引用,
// 在Excel文档中,第一张工作表的缺省索引是0,
// 其语句为:HSSFSheet sheet = workbook.getSheetAt(0);
HSSFSheet sheet = workbook.getSheet(
"Sheet1"
);
int
rows=sheet.getLastRowNum();
for
(
int
i=
0
;i<=rows;i++){
HSSFRow row=sheet.getRow(i);
int
cells=row.getLastCellNum();
for
(
int
j=
0
;j<cells;j++){
HSSFCell cell=row.getCell(j);
if
(cell!=
null
){
if
(cell.getCellType()==HSSFCell.CELL_TYPE_STRING){
System.out.print(cell.getStringCellValue());
}
else
if
(cell.getCellType()==HSSFCell.CELL_TYPE_NUMERIC){
System.out.print(cell.getNumericCellValue());
}
else
if
(cell.getCellType()==HSSFCell.CELL_TYPE_BOOLEAN){
System.out.print(cell.getBooleanCellValue());
}
}
System.out.print(
","
);
}
System.out.println();
}
}
}
|
上面解析一个aaa.xls的文件,并将内容打印出来,当然,这里打印出来的内容不太准确,
因为单元格类型在api中只提供6种,但是其中并没有日期等。
apache poi也可以解析2007格式的office文档,
操作xlsx相对于xls,api基本是相同的,只是把HSSF都改成XSSF就行。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
|
package
com.zhou.test;
import
java.io.FileInputStream;
import
java.io.FileNotFoundException;
import
java.io.IOException;
import
org.apache.poi.xssf.usermodel.XSSFCell;
import
org.apache.poi.xssf.usermodel.XSSFRow;
import
org.apache.poi.xssf.usermodel.XSSFSheet;
import
org.apache.poi.xssf.usermodel.XSSFWorkbook;
public
class
ReadXlsx {
public
static
void
main(String[] args)
throws
FileNotFoundException, IOException {
//路径
String fileToBeRead =
"E:\\aaa.xlsx"
;
// 创建对Excel工作簿文件的引用
XSSFWorkbook workbook=
new
XSSFWorkbook(
new
FileInputStream(
fileToBeRead));
// 创建对工作表的引用。
XSSFSheet sheet=workbook.getSheetAt(
0
);
int
rows=sheet.getLastRowNum();
for
(
int
i=
0
;i<=rows;i++){
XSSFRow row=sheet.getRow(i);
int
cells=row.getLastCellNum();
for
(
int
j=
0
;j<cells;j++){
XSSFCell cell=row.getCell(j);
if
(cell!=
null
){
if
(cell.getCellType()==XSSFCell.CELL_TYPE_STRING){
System.out.print(cell.getStringCellValue());
}
else
if
(cell.getCellType()==XSSFCell.CELL_TYPE_NUMERIC){
System.out.print(cell.getNumericCellValue());
}
else
if
(cell.getCellType()==XSSFCell.CELL_TYPE_BOOLEAN){
System.out.print(cell.getBooleanCellValue());
}
}
System.out.print(
","
);
}
System.out.println();
}
}
}
|