使用java将word文档转化为html格式
Microsoft Word文档到HTML文档的转化(环境配置)
在该部分的转化中,使用了JACOB Project(A Java-COM Bridge)一种Java到com的连接桥来操作基于com模型的Microsoft word文档。使用Jocob基本上可以完全操作word文档,在该例中主要使用了JACOB来操作word文档另存为HTML文档。
首先在/JACOB/下载JACOB开源包,目前该开源项目已经移至S[17]。本系统使用的是JACOB_1.9,下载解压后的JACOB_1.9目录下主要有以下三个文件:Java doc描述文件、JACOB.dll、JACOB.jar。填加JACOB.dll到系统//windows//system32//目录下或者安装Java的bin目录下;在eclipse环境下填加JACOB.jar到自己的Java库中,填加方法是在包资源管理器下点击鼠标右键选择 构建路径//配置构建路径//Java构建路径//库//添加外部jar 然后在弹出窗口中选择外部jar路径,也就是JACOB.jar的所在的文件夹。
做好以上的环境配置工作后,就可以正确使用JACOB来操作Microsoft word文档了。在该例中,主要使用了JACOB来操作word另存为HTML文件。核心操作代码见下文。
使用java将word文档转化为html格式(续)
2008-07-06 23:13
Microsoft Word文档到HTML文档的转化(实现代码)
import com.jacob.activeX.*;
import .*;
import Java.io.File;
public class WordToHtml {
public static void convertDocToHtml(String inputFile, String outputFile) {
boolean flag = false;
// 打开Word应用程序
ActiveXComponent app = new ActiveXComponent("Word.Application");
try {
//设置word不可见
app.setProperty("Visible", new Variant(false));
// 打开word文件
Dispatch doc1 = app.getProperty("Documents").toDispatch();
Dispatch doc2 = Dispatch.invoke(doc1,"Open",Dispatch.Method,new Object[] { inputFile, new Variant(false),new Variant(true) }, new int[1]).toDispatch();
//new Variant(i)参量用来控制word文档另存为的目标文档格;i=7时word存为txt文件; i=8时word存为HTML文件
Dispatch.invoke(doc2, "SaveAs", Dispatch.Method, new Object[] {outputFile, new Variant(8) }, new int[1]);
// 关闭word
Variant f = new Variant(false);Dispatch.call(doc2, "close", f);
flag = true;
} catch (Exception e) {
e.printStackTrace();
} finally {
app.invoke("Quit", new Variant[] {});
}
if (flag == true) {
System.out.println(inputFile + " --> Transforme Successfully");
} else {
System.out.println(inputFile + " --> Transform Failed");
}
}
}
package com.test;import java.sql.Connection; import java.sql.DriverManager; impor