Java读取word文件

Java读取word文件需要使用 Apache poi.jar,可以在这里下载点击打开链接


代码如下:

package com.ssh.util;
import java.io.File;
import java.io.FileInputStream;

import java.io.InputStream;

import org.apache.poi.POIXMLDocument;
import org.apache.poi.POIXMLTextExtractor;
import org.apache.poi.hwpf.extractor.WordExtractor;
import org.apache.poi.openxml4j.opc.OPCPackage;
import org.apache.poi.xwpf.extractor.XWPFWordExtractor;

public class WordExcel {
	
    public static String readWord(File file){
	if(file != null){
		if(file.getName().endsWith("docx")){
			//处理word2007
			return readWord2007(file);
		}else if(file.getName().endsWith("doc")){
			//处理word2003
			return readWord2003(file);
		}
		else{
			return null;
		}
	}else{
		return null;
	}
    }
	
    private static String readWord2003(File file) {
    	try {
		InputStream is = new FileInputStream(file);
		WordExtractor ex = new WordExtractor(is);
		String text = ex.getText();
		return text;
	} catch (Exception e) {
		// TODO Auto-generated catch block
		e.printStackTrace();
	}
        return null;
    }

    private static String readWord2007(File file) {
	try {
		OPCPackage opcPackage = POIXMLDocument.openPackage(file.getAbsolutePath());
		POIXMLTextExtractor extractor = new XWPFWordExtractor(opcPackage);
		String text = extractor.getText();
		return text;
	} catch (Exception e) {
		// TODO Auto-generated catch block
		e.printStackTrace();
	}
	return null;
    }

    public static void main(String[] args) {
	String text = WordExcel.readWord(new File("****.doc"));
        System.out.println(text);
    }
}


                
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值