doc转换成html接口,在Java中以编程方式将Word doc转换为HTML

我在无法使用新MS Word XML格式的生产系统中成功使用了以下方法:

产生一个执行类似于以下内容的过程:

http://www.oooninja.com/2008/02/batch-command-line-file-conversion-with.html

您可能希望在程序启动时启动一次openoffice,并在程序中多次调用python脚本(需要进行某种检查以确保ooffice进程始终存在)。

另一种选择是每次需要进行转换时都生成以下命令:

ooffice -headless“ macro:// ”

我已多次使用宏方法,并且效果很好(对不起,我没有可用的宏代码)。

尽管有通过MS Word进行操作的机制,但从Java上来说并不容易,并且确实需要其他支持程序才能通过OLE驱动MS Word。

我之前也使用过abiword,它对于许多文档都适用,但是确实与更复杂的文档相混淆(办公室似乎可以处理我向它扔的所有东西)。Abiword的命令行界面比ooffice更加轻松。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值