java解析获取Excel中的数据--同时兼容2003及2007

   首先大家先了解一下以下内容:引用 http://feitian0127.iteye.com/blog/1152524

    java解析Excel(兼容2003及2007)


刚开始从网上找了个例子使用new HSSFWorkbook(new FileInputStream(excelFile))来读取Workbook,
对Excel2003以前(包括2003)的版本没有问题,但读取Excel2007时发生如下异常:
org.apache.poi.poifs.filesystem.OfficeXmlFileException: The supplied data appears to be in the Office 2007+ XML. You are calling the part of POI that deals with OLE2 Office Documents. You need to call a different part of POI to process this data (eg XSSF instead of HSSF)

        该错误意思是说,文件中的数据是用Office2007+XML保存的,而现在却调用OLE2 Office文档处理,应该使用POI不同的部分来处理这些数据,比如使用XSSF来代替HSSF。

        于是按提示使用XSSF代替HSSF,用new XSSFWorkbook(excelFile)来读取Workbook,对Excel2007没有问题了,可是在读取Excel2003以前(包括2003)的版本时却发生了如下新异常:
org.apache.poi.openxml4j.exceptions.InvalidOperationException: Can't open the specified file: '*.xls'
        该错误是说,操作无效,不能打开指定的xls文件。

        到网上查了下,原来是XSSF不能读取Excel2003以前(包括2003)的版本,这样的话,就需要在读取前判断文件是2003前的版本还是2007的版本,然后对应调用HSSF或XSSF来读取。
        这种做法比较麻烦,看了下API,发现XSSF和HSSF虽然在不同的包里,但却引用了同一接口Workbook,于是想到了这样的读取方法:
        Workbook book = null;
        try {
            book = new XSSFWorkbook(excelFile);
        } catch (Exception ex) {
            book = new HSSFWorkbook(new FileInputStream(excelFile));
        }
       
本认为程序应该没错了吧,但一运行还是报错(当时用得是poi3.6的zip包):

java.lang.ClassNotFoundException: org.openxmlformats.schemas.spreadsheetml.x2006.main.CTSheet

网上搜了下,是少poi-ooxml-schemas-xxx.jar包,根据提示在Apache网站上(http://labs.renren.com/apache-mirror//poi/release/bin/)下载了3.7的zip文件(poi-bin-3.7-20101029.zip),解压后将poi相关的包和xml相关的包都放上去。

在各版本的Excel中测试,没有发生异常,问题解决。

下面是POI的API网址,不过是英文的:
POI API Documentation
http://poi.apache.org/apidocs/index.html

 

   转入正题:以下是代码,代码也是从别人的代码拿过来的,其中修改了部分

package com.execl;

import java.io.File;

import java.io.FileInputStream;

import java.io.IOException;

import java.io.InputStream;

import java.util.ArrayList;

import java.util.List;

import org.apache.poi.hssf.usermodel.HSSFCell;
import org.apache.poi.hssf.usermodel.HSSFWorkbook;

import org.apache.poi.ss.usermodel.Cell;

import org.apache.poi.ss.usermodel.Row;

import org.apache.poi.ss.usermodel.Sheet;

import org.apache.poi.ss.usermodel.Workbook;

import org.apache.poi.xssf.usermodel.XSSFWorkbook;

/**
 * 
 * @描述:测试excel读取
 * 
 *               导入的jar包
 * 
 *               poi-3.8-beta3-20110606.jar
 * 
 *               poi-ooxml-3.8-beta3-20110606.jar
 * 
 *               poi-examples-3.8-beta3-20110606.jar
 * 
 *               poi-excelant-3.8-beta3-20110606.jar
 * 
 *               poi-ooxml-schemas-3.8-beta3-20110606.jar
 * 
 *               poi-scratchpad-3.8-beta3-20110606.jar
 * 
 *               xmlbeans-2.3.0.jar
 * 
 *               dom4j-1.6.1.jar
 * 
 *               jar包官网下载地址:http://poi.apache.org/download.html
 * 
 *               下载poi-bin-3.8-beta3-20110606.zipp
 * 
 * @作者:建宁
 * 
 * @时间:2012-08-29 下午16:27:15
 */

public class ImportExecl
{

	/** 总行数 */

	private int totalRows = 0;

	/** 总列数 */

	private int totalCells = 0;

	/** 错误信息 */

	private String errorInfo;

	/** 构造方法 */

	public ImportExecl()
	{

	}

	/**
	 * 
	 * @描述:得到总行数
	 * 
	 * @作者:建宁
	 * 
	 * @时间:2012-08-29 下午16:27:15
	 * 
	 * @参数:@return
	 * 
	 * @返回值:int
	 */

	public int getTotalRows()
	{

		return totalRows;

	}

	/**
	 * 
	 * @描述:得到总列数
	 * 
	 * @作者:建宁
	 * 
	 * @时间:2012-08-29 下午16:27:15
	 * 
	 * @参数:@return
	 * 
	 * @返回值:int
	 */

	public int getTotalCells()
	{

		return totalCells;

	}

	/**
	 * 
	 * @描述:得到错误信息
	 * 
	 * @作者:建宁
	 * 
	 * @时间:2012-08-29 下午16:27:15
	 * 
	 * @参数:@return
	 * 
	 * @返回值:String
	 */

	public String getErrorInfo()
	{

		return errorInfo;

	}

	/**
	 * 
	 * @描述:验证excel文件
	 * 
	 * @作者:建宁
	 * 
	 * @时间:2012-08-29 下午16:27:15
	 * 
	 * @参数:@param filePath 文件完整路径
	 * 
	 * @参数:@return
	 * 
	 * @返回值:boolean
	 */

	public boolean validateExcel(String filePath)
	{

		/** 检查文件名是否为空或者是否是Excel格式的文件 */

		if (filePath == null || !(WDWUtil.isExcel2003(filePath) || WDWUtil.isExcel2007(filePath)))
		{

			errorInfo = "文件名不是excel格式";

			return false;

		}

		/** 检查文件是否存在 */

		File file = new File(filePath);

		if (file == null || !file.exists())
		{

			errorInfo = "文件不存在";

			return false;

		}

		return true;

	}

	/**
	 * 
	 * @描述:根据文件名读取excel文件
	 * 
	 * @作者:建宁
	 * 
	 * @时间:2012-08-29 下午16:27:15
	 * 
	 * @参数:@param filePath 文件完整路径
	 * 
	 * @参数:@return
	 * 
	 * @返回值:List
	 */

	public List<List<String>> read(String filePath)
	{

		List<List<String>> dataLst = new ArrayList<List<String>>();

		InputStream is = null;

		try
		{

			/** 验证文件是否合法 */

			if (!validateExcel(filePath))
			{

				System.out.println(errorInfo);

				return null;

			}

			/** 判断文件的类型,是2003还是2007 */

			boolean isExcel2003 = true;

			if (WDWUtil.isExcel2007(filePath))
			{

				isExcel2003 = false;

			}

			/** 调用本类提供的根据流读取的方法 */

			File file = new File(filePath);

			is = new FileInputStream(file);

			dataLst = read(is, isExcel2003);

			is.close();

		}
		catch (Exception ex)
		{

			ex.printStackTrace();

		}
		finally
		{

			if (is != null)
			{

				try
				{

					is.close();

				}
				catch (IOException e)
				{

					is = null;

					e.printStackTrace();

				}

			}

		}

		/** 返回最后读取的结果 */

		return dataLst;

	}

	/**
	 * 
	 * @描述:根据流读取Excel文件
	 * 
	 * @作者:建宁
	 * 
	 * @时间:2012-08-29 下午16:40:15
	 * 
	 * @参数:@param inputStream
	 * 
	 * @参数:@param isExcel2003
	 * 
	 * @参数:@return
	 * 
	 * @返回值:List
	 */

	public List<List<String>> read(InputStream inputStream, boolean isExcel2003)
	{

		List<List<String>> dataLst = null;

		try
		{

			/** 根据版本选择创建Workbook的方式 */

			Workbook wb = null;

			if (isExcel2003)
			{
				wb = new HSSFWorkbook(inputStream);
			}
			else
			{
				wb = new XSSFWorkbook(inputStream);
			}
			dataLst = read(wb);

		}
		catch (IOException e)
		{

			e.printStackTrace();

		}

		return dataLst;

	}

	/**
	 * 
	 * @描述:读取数据
	 * 
	 * @作者:建宁
	 * 
	 * @时间:2012-08-29 下午16:50:15
	 * 
	 * @参数:@param Workbook
	 * 
	 * @参数:@return
	 * 
	 * @返回值:List<List<String>>
	 */

	private List<List<String>> read(Workbook wb)
	{

		List<List<String>> dataLst = new ArrayList<List<String>>();

		/** 得到第一个shell */

		Sheet sheet = wb.getSheetAt(0);

		/** 得到Excel的行数 */

		this.totalRows = sheet.getPhysicalNumberOfRows();

		/** 得到Excel的列数 */

		if (this.totalRows >= 1 && sheet.getRow(0) != null)
		{

			this.totalCells = sheet.getRow(0).getPhysicalNumberOfCells();

		}

		/** 循环Excel的行 */

		for (int r = 0; r < this.totalRows; r++)
		{

			Row row = sheet.getRow(r);

			if (row == null)
			{

				continue;

			}

			List<String> rowLst = new ArrayList<String>();

			/** 循环Excel的列 */

			for (int c = 0; c < this.getTotalCells(); c++)
			{

				Cell cell = row.getCell(c);

				String cellValue = "";

				if (null != cell)
				{
					// 以下是判断数据的类型
					switch (cell.getCellType())
					{
					case HSSFCell.CELL_TYPE_NUMERIC: // 数字
						cellValue = cell.getNumericCellValue() + "";
						break;

					case HSSFCell.CELL_TYPE_STRING: // 字符串
						cellValue = cell.getStringCellValue();
						break;

					case HSSFCell.CELL_TYPE_BOOLEAN: // Boolean
						cellValue = cell.getBooleanCellValue() + "";
						break;

					case HSSFCell.CELL_TYPE_FORMULA: // 公式
						cellValue = cell.getCellFormula() + "";
						break;

					case HSSFCell.CELL_TYPE_BLANK: // 空值
						cellValue = "";
						break;

					case HSSFCell.CELL_TYPE_ERROR: // 故障
						cellValue = "非法字符";
						break;

					default:
						cellValue = "未知类型";
						break;
					}
				}

				rowLst.add(cellValue);

			}

			/** 保存第r行的第c列 */

			dataLst.add(rowLst);

		}

		return dataLst;

	}

	/**
	 * 
	 * @描述:main测试方法
	 * 
	 * @作者:建宁
	 * 
	 * @时间:2012-08-29 下午17:12:15
	 * 
	 * @参数:@param args
	 * 
	 * @参数:@throws Exception
	 * 
	 * @返回值:void
	 */

	public static void main(String[] args) throws Exception
	{

		ImportExecl poi = new ImportExecl();

		// List<List<String>> list = poi.read("d:/aaa.xls");

		List<List<String>> list = poi.read("c:/book.xlsx");

		if (list != null)
		{

			for (int i = 0; i < list.size(); i++)
			{

				System.out.print("第" + (i) + "行");

				List<String> cellList = list.get(i);

				for (int j = 0; j < cellList.size(); j++)
				{

					// System.out.print("    第" + (j + 1) + "列值:");

					System.out.print("    " + cellList.get(j));

				}
				System.out.println();

			}

		}

	}

}

/**
 * 
 * @描述:工具类
 * 
 * @作者:建宁
 * 
 * @时间:2012-08-29 下午16:30:40
 */

class WDWUtil
{

	/**
	 * 
	 * @描述:是否是2003的excel,返回true是2003
	 * 
	 * @作者:建宁
	 * 
	 * @时间:2012-08-29 下午16:29:11
	 * 
	 * @参数:@param filePath 文件完整路径
	 * 
	 * @参数:@return
	 * 
	 * @返回值:boolean
	 */

	public static boolean isExcel2003(String filePath)
	{

		return filePath.matches("^.+\\.(?i)(xls)$");

	}

	/**
	 * 
	 * @描述:是否是2007的excel,返回true是2007
	 * 
	 * @作者:建宁
	 * 
	 * @时间:2012-08-29 下午16:28:20
	 * 
	 * @参数:@param filePath 文件完整路径
	 * 
	 * @参数:@return
	 * 
	 * @返回值:boolean
	 */

	public static boolean isExcel2007(String filePath)
	{

		return filePath.matches("^.+\\.(?i)(xlsx)$");

	}

}

 

 

 

 

 算吧!  我把我的源码也放上—— 哈哈

 

            http://download.csdn.net/detail/mmm333zzz/4560058


 

  • 14
    点赞
  • 71
    收藏
    觉得还不错? 一键收藏
  • 20
    评论
在使用Java导出Excel文件时,由于Excel文件的数据结构比较复杂,需要使用特定的格式和方法来保存及读取数据。虽然Java提供了一些API可以用来创建和编辑Excel文件,但是由于不同的版本和设置可能会导致不兼容的情况。因此,在导出Excel文件时使用另存为可以更好地保证数据的可读性和可解析性。 Java导出Excel文件时,通常使用Apache POI库来进行操作。这个库支持各种Excel文件格式,可以在Java方便地创建、编辑和读取Excel文件数据。但是在使用POI库生成Excel文件时,需要注意一些细节,这些细节可能会导致文件无法正常解析。其一个常见的问题就是版本不兼容性。 Excel文件的版本和格式非常复杂,不同的版本和设置可能会带来不同的问题。如果Excel文件不是使用最新的版本(例如.xlsx格式),则可能需要使用早期版本(例如.xls格式)来保存文件。此外,在文件格式还有一些设置,如字符编码、列宽、日期格式等,也可能会对文件的解析造成影响。 另存为是一种可行的解决方法,它可以将Java导出的Excel文件先另存为一种可兼容的格式,然后再进行解析。例如,可以将Java生成的Excel文件先保存为.xls格式,然后再使用解析器将其读取。这样可以避免版本和格式不兼容的问题,保证Excel文件的可读性和可解析性。 总之,在Java导出Excel文件时,建议使用另存为来保证文件的可读性和可解析性。另外,在使用POI库生成Excel文件时,需要注意一些细节,并尽可能地使用最新的版本和可兼容的格式来保存文件。这样才能保证生成的Excel文件可以被其他程序或人员正常解析,发挥实际作用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 20
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值