java读取world文档

最新推荐文章于 2024-07-26 16:03:13 发布

kingschan

最新推荐文章于 2024-07-26 16:03:13 发布

阅读量818

点赞数

分类专栏： java 文章标签： java

本文链接：https://blog.csdn.net/kingschan/article/details/84473435

版权

java 专栏收录该内容

25 篇文章 0 订阅

订阅专栏

说明：只支持world 2003 不支持2007 以及用WPS新建的world文档


package world;

import java.io.File;
import java.io.FileInputStream;

import org.textmining.text.extraction.WordExtractor;

public class WorldDemo {
	public static String readDoc(String doc) throws Exception {
		  // 创建输入流读取doc文件
		  FileInputStream in = new FileInputStream(new File(doc));
		  WordExtractor extractor = null;
		  String text = null;
		  // 创建WordExtractor
		  extractor = new WordExtractor();
		  // 对doc文件进行提取
		  text = extractor.extractText(in);
		  return text;
		 }
		 /**
		  * @param args
		  */
		 public static void main(String[] args) {
		  // TODO Auto-generated method stub
		        try{
		         String text = WorldDemo.readDoc("D:\\3.doc");
		         System.out.println(text);
		        }catch(Exception ex){
		         ex.printStackTrace();
		        }
		 }
}

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

kingschan

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
java读取world文档

说明：只支持world 2003 不支持2007 以及用WPS新建的world文档[code="java"]package world;import java.io.File;import java.io.FileInputStream;import org.textmining.text.extraction.WordExtractor;public cl...
复制链接

扫一扫