以下是原来博客的内容。
这一讲的基本内容有:
1、创建一个时间格式的单元格
2、处理不同内容格式的单元格
3、遍历工作簿的行和列并获取单元格内容
4、文本提取
第 2 讲的示例代码是:Demo4-Demo7。
下面我们将介绍创建单元格的一些比较深入的用法,当然就是熟悉一些接口。
1、创建一个时间格式的单元格
上面我们只是简单地使用了 Cell 类提供的 setCellValue() 的几个重载的方法设置了单元格。对于日期类型的单元格当然我们也可以直接使用 Java 提供的日期格式化类来实现。这里我们看看 POI 是如何帮助我们实现的。
需要认识的接口:
CellStyle:为单元格设置样式;
CreationHelper 可以理解为一个工具类,由这个工具类可以获得 日期格式化的一个实例,然后再传到 CellStyle 里面。请看下面这个例子。
这里还需要说明的是:Workbook 使用完毕也需要像 io 流一样是关闭的,否则编译器会给出警告。
示例代码:
public static void main(String[] args) throws IOException {
Workbook wb = new HSSFWorkbook();
Sheet sheet1 = wb.createSheet("三年级(1)班学生名单");
// CreationHelper 可以理解为一个工具类,由这个工具类可以获得 日期格式化的一个实例
CreationHelper createHelper = wb.getCreationHelper();
// CellStyle 为单元格创建样式的一个接口
CellStyle cellStyle = wb.createCellStyle();
cellStyle.setDataFormat(createHelper.createDataFormat().getFormat("yyyy-mm-dd hh:mm:ss"));
Row row = sheet1.createRow(0);
// 设置单元格的值为日期类型,这里就涉及到了日期类型值的格式化问题
Cell c1 = row.createCell(0);
c1.setCellValue(new Date());
c1.setCellStyle(cellStyle);
// 还可以设置单元格的值为 Calendar 的实例
// Calendar.getInstance();
// 获取当天指定点上的时间
Cell c2 = row.createCell(1);
c2.setCellValue(Calendar.getInstance());
c2.setCellStyle(cellStyle);
FileOutputStream fos = new FileOutputStream(
"c:\\POI使用FileOutputStream输出流生成的工作簿.xls");
wb.write(fos);
fos.close();
// wb 是需要关闭的,否则编译器会有提示
wb.close();
}
2、处理不同内容格式的单元格
这个例子其实上面已经提到过,无非就是使用一组重载的方法。有时间的话,我们可以关注一下 HSSFCell 这个类里面的静态量的用法。‘
示例代码:
public static void main(String[] args) throws IOException {
Workbook wb = new HSSFWorkbook();
Sheet sheet1 = wb.createSheet("三年级(1)班学生名单");
Row row = sheet1.createRow(0);
row.createCell(0).setCellValue(1);
row.createCell(1).setCellValue("一个字符串");
row.createCell(2).setCellValue(true);
row.createCell(3).setCellValue(HSSFCell.CELL_TYPE_NUMERIC);
row.createCell(4).setCellValue(false);
FileOutputStream fos = new FileOutputStream(
"c:\\POI使用FileOutputStream输出流生成的工作簿.xls");
wb.write(fos);
fos.close();
// wb 是需要关闭的,否则编译器会有提示
wb.close();
}
3、遍历工作簿的行和列并获取单元格内容
如果我们直接使用 cell.getStringCellValue() 方法获取单元格,对于文本类型的单元格来说是适用的。但是对于其他类型的单元格就会出问题。例如:
为此,我们需要自己封装一个方法用于获得单元格的数据,获取数据之前先做一个判断。
这里有一个非常奇怪的现象,当我获取行的时候,使用 sheet.getLastRowNum() 方法获取所有的行数的时候, POI 总是漏掉一行,处理的办法就是 +1。
示例代码:
public class Demo1 {
public static void main(String[] args) throws IOException {
FileInputStream fis = new FileInputStream("c:\\学生名单.xls");
POIFSFileSystem fs = new POIFSFileSystem(fis);
HSSFWorkbook wb = new HSSFWorkbook(fs);
HSSFSheet sheet = wb.getSheetAt(0);
if (sheet == null) {
return;
}
// 遍历行
Row row = null;
Cell cell = null;
for (int rowNum = 0; rowNum < sheet.getLastRowNum() + 1; rowNum++) {
row = sheet.getRow(rowNum);
if (row == null) {
continue;
}
// 遍历单元格
for (int cellNum = 0; cellNum < row.getLastCellNum(); cellNum++) {
cell = row.getCell(cellNum);
System.out.print(getCellDate(cell) + " ");
}
System.out.println();
}
wb.close();
}
private static String getCellDate(Cell cell) {
String return_string = null;
switch (cell.getCellType()) {
case HSSFCell.CELL_TYPE_STRING:
return_string = cell.getStringCellValue();
break;
case HSSFCell.CELL_TYPE_NUMERIC:
return_string = cell.getNumericCellValue() + "";
break;
case HSSFCell.CELL_TYPE_BOOLEAN:
return_string = String.valueOf(cell.getBooleanCellValue());
default:
return_string = "";
break;
}
return return_string;
}
}
4、文本提取
文本提取是个什么意思呢?先上图。
POI 无非就是帮我们提取了你所看到的 Excel 文档当中的所有文本成为 String 类型的数据。我想还是比较有用的。如果要实现搜索、筛选功能,在一定场合下,比遍历整张表的单元格效率会高一些。
示例代码:
public static void main(String[] args) throws IOException {
FileInputStream fis = new FileInputStream("c:\\学生名单.xls");
POIFSFileSystem fs = new POIFSFileSystem(fis);
HSSFWorkbook wb = new HSSFWorkbook(fs);
ExcelExtractor excelExtractor = new ExcelExtractor(wb);
// 设置抽取的文本是否包括 Sheet 页的名称
excelExtractor.setIncludeSheetNames(false);
System.out.println(excelExtractor.getText());
excelExtractor.close();
wb.close();
}