使用Jcob将Word转为Html或txt

转载 2007年09月11日 21:45:00
  //------------------------------------------------------------------------------
  //版权所有 (C) 浪潮集团商用系统有限公司  保留所有权利
  //文件名称: wordtohtml           文件版本: 1.00.00
  //作    者: 郭铸     作者邮箱: guozhu@langchao.com  完成日期: 2004-10-20
  //文件描述:
  //其它描述:
  //类 列 表:
  //  wordtohtml: 将指定目录下面所有的doc文件转化为HTML并存储在相同目录下
  //修改历史:
  //  #   版本     修改日期    作者                 修改内容
  //  ----------------------------------------------------------------------------
  //  1   1.00.01  2004-10-14  作者姓名             修改内容描述
  //  ----------------------------------------------------------------------------
  //------------------------------------------------------------------------------
  import com.jacob.com.*;
  import com.jacob.activeX.*;
  import java.io.*;

  //取得指定目录下面所有的doc文件名称
  public class wordtohtml
  {
  //------------------------------------------------------------------------------
  //方法原型: change(String paths)
  //功能描述: 将指定目录下面所有的doc文件转化为HTML并存储在相同目录下
  //输入参数: String
  //输出参数: 无
  //返 回 值: 无
  //其它说明: 递归
  //------------------------------------------------------------------------------
  public static void change(String paths, String savepaths)
  {
  
  File d = new File(paths);
  //取得当前文件夹下所有文件和目录的列表
  File lists[] = d.listFiles();
  String pathss = new String("");

  //对当前目录下面所有文件进行检索
  for(int i = 0; i < lists.length; i ++)
  {
  if(lists[i].isFile())
  {
  String filename = lists[i].getName();
  String filetype = new String("");
  //取得文件类型
  filetype = filename.substring((filename.length() - 3), filename.length());
  
  //判断是否为doc文件
  if(filetype.equals("doc"))
  {
  System.out.println("当前正在转换......");
  //打印当前目录路径
  System.out.println(paths);
  //打印doc文件名
  System.out.println(filename.substring(0, (filename.length() - 4)));
  
  ActiveXComponent app = new ActiveXComponent("Word.Application");//启动word
  
  String docpath = paths + filename;
  String htmlpath = savepaths + filename.substring(0, (filename.length() - 4));
  
  String inFile = docpath;
  //要转换的word文件
  String tpFile = htmlpath;
  //HTML文件

  boolean flag = false;
  
  try
  {
  app.setProperty("Visible", new Variant(false));
  //设置word不可见

        Object docs = app.getProperty("Documents").toDispatch();
  Object doc = Dispatch.invoke(docs,"Open", Dispatch.Method, new Object[]{inFile,new Variant(false), new Variant(true)}, new int[1]).toDispatch();
  //打开word文件
  Dispatch.invoke(doc,"SaveAs", Dispatch.Method, new Object[]{tpFile,new Variant(8)}, new int[1]);
  //作为html格式保存到临时文件
  Variant f = new Variant(false);
  Dispatch.call(doc, "Close", f);
  flag = true;
  }
  catch (Exception e)
  {
  e.printStackTrace();
  }
  finally
  {
  app.invoke("Quit", new Variant[] {});
  }
  System.out.println("转化完毕!");
  }
  }
  else
  {
  pathss = paths;
  //进入下一级目录
  pathss = pathss + lists[i].getName() + "//";   
  //递归遍历所有目录
  change(pathss, savepaths);
  }
  }
  
  }
  //------------------------------------------------------------------------------
  //方法原型: main(String[] args)
  //功能描述: main文件
  //输入参数: 无
  //输出参数: 无
  //返 回 值: 无
  //其它说明: 无
  //------------------------------------------------------------------------------ 
  public static void main(String[] args)
  {
  
  String paths = new String("D://Work//2004.10.8//test system//test01//word//");
  String savepaths = new String ("D://Work//2004.10.8//test system//test01//html//");

  change(paths, savepaths);

  }
        }

相关文章推荐

JCOB分分钟word和excel互转,word和excel转html,webApp的福利

安卓APP支持office相对来说比较的繁琐,福利来了,我们换个想法,把word文档直接转换成html然后开启webApp模式开观看。瞬间解决了在自己的软件里面打开word文档。 下载JCOB核心源...

使用Java将Word转为Html或txt!

  • 2008年07月07日 09:23
  • 4KB
  • 下载

使用Jacob批量转换word为txt、pdf、xps、html、xml等文档

Jacob全称位java com bridge,通过该插件,可以使用Java语言编写程序,调用COM、ActiveX组件来操作Windows本地程序。 参考一位网友的例子,我写了一个程序,用来将wo...

word文档转换为PDF、jpg、HTML、txt、swf

好记性不如烂笔头,写下来以后参考  word转换为PDF   ///                   ///          /// 把Word文件转换成为PDF格式文件      ...
  • chhdxzq
  • chhdxzq
  • 2015年08月21日 19:15
  • 850

lucene索引word/pdf/html/txt文件及检索(搜索引擎) 转载于http://blog.csdn.net/shiljcn/article/details/6179479

因为lucene索引的时候是将String型的信息建立索引的,所以这里必须是将word/pdf/html等文件的内容转化问字符型。 lucene的jar包自己去下载。 首先是建立索引的代码: ...

几个DataSet数据导出到XML Word Excel TXT HTML的函数

procedure ExpXML(DataSet : TDataSet; Arq : string); var i: integer; xml: TXMLDocument; reg...

将word、excel、ppt、html、txt,pdf转换成图片源代码

分享一下我的实现方式:首先利用openoffice将各种类型的文档转换成pdf,然后再利用imagsio将pdf转成图片。           那么我们下面谈一下如何处理:        ...

PDF文件转化成word,ppt,excel,图片(png,jpg...),tiff,rtf,txt,html,PDF组合,PDF编辑,PDF创建

PDF文件转化成word,ppt,excel,图片(png,jpg...),tiff,rtf,txt,html,PDF组合,PDF编辑,PDF创建...

JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法

WORD Java代码 package textReader;  import java.io.*;  import org.apache.poi.hwpf.extractor.Wor...

java实现爬虫技术,读取txt,word,excel,ppt,pdf,html等格式的文件

最近跟我同事一起做的项目要求读取txt,word,excel,ppt,pdf,html中的内容,不多说,先把代码贴出来,之后有时间再来做详细的解读。 这是读取txt文件 /** * 获取t...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:使用Jcob将Word转为Html或txt
举报原因:
原因补充:

(最多只允许输入30个字)