调用示例:
File wordFile = new File("D:\\temp.doc");
//读取Word文档中所有文本内容,以字符串形式返回
System.out.println(WordFileUtil.extractTextFromWordFile(wordFile));
工具类源码:
Word2003版本工具类:
/**
* Word2003FileUtil.java
* Copyright ® 2010 窦海宁
* All right reserved
*/
package org.aiyu.core.common.util.file.office;
import java.io.File;
import java.io.FileInputStream;
import java.io.InputStream;
import org.apache.commons.io.IOUtils;
import org.apache.poi.hwpf.extractor.WordExtractor;
/**
* <p>Word2003版文件工具类
*
* <p>通用的Word2003版文件工具类,可用于从Word文档中抽取文本信息
*
* @author 窦海宁, chong0660@sina.com
* @since AiyuCommonCore-1.0
* @version AiyuCommonCore-1.0
*/
public abstract class Word2003FileUtil {
/**
* <