java word转html
word自带另存为html
一.用jacob转
JACOB - Java COM Bridge
JACOB一个Java-COM中间件.通过这个组件你可以在Java应用程序中调用COM组件和Win32程序库。
示例代码自己搜索
优点:调用原生接口,效果好。
缺点:只能在windows上用。
二.用apache openoffice转
OpenOffice.org 是一套跨平台的办公室软件套件,能在 Windows、Linux、MacOS X (X11)和 Solaris 等操作系统上执行。它与各个主要的办公室软件套件兼容。OpenOffice.org 是自由软件,任何人都可以免费下载、使用及推广它。
优点:
1.转换简单,调用一个方法
2.转换效果良好。
3.windows,linux都可用。
缺点:
1.得安装openoffice,100多M,
3.aix上似乎不能用。
示例代码后续补充
三.用apache poi转
Apache POI是Apache软件基金会的开放源码函式库,POI提供API给Java程序对Microsoft Office格式档案读和写的功能。
结构:
HSSF - 提供读写Microsoft Excel格式档案的功能。
XSSF - 提供读写Microsoft Excel OOXML格式档案的功能。
HWPF - 提供读写Microsoft Word格式档案的功能。
HSLF - 提供读写Microsoft PowerPoint格式档案的功能。
HDGF - 提供读写Microsoft Visio格式档案的功能。
优点:
1.转换相对简单,调用一个方法
2.转换效果良好。
3.windows,linux都可用。aix上应该也支持。
4.03,07格式都支持。
缺点:
转07格式时,table没边框,有待解决。
doc中含有emf图片可以转,docx中有emf图片有问题
poi完美word03转html(表格、图片、样式)
http://chembo.iteye.com/blog/1510536
应用POI,word2007转html
http://happyqing.iteye.com/blog/2086450
office to html (1) 支持03,07 和excel
http://blog.163.com/bai_yubo@yeah/blog/static/141551715201322231735622/
自己解析word,转html,难度较大,格式较差
Java引用POI实现Word转Html方法
http://blog.csdn.net/cornfieldc01/article/details/6339801
求poi将word转换为html文件的例子