文档格式转换利器XDocIO
我们面临文档格式很多,office文档就6种:doc、docx、xls、xlsx、ppt、pptx,还有pdf、rtf、htm等等。
我们经常需要从这些文档中读取文本、图片等内容,或者把我们已有的内容写入到这些文档中。这个过程是很痛苦的,不同的文档格式对应不同API,学习这些API会消耗我们大量的精力。。。
我们能不能用一个简单的方法来处理这些文档格式?
XDocIO可以很好的对付它们,它的本质是使用中间文档格式XDOC。XDOC是一个简单的XML,比HTML还简单。来看看它的规范吧:
http://www.hgsql.com/down/fpd.swf?dataUrl=XDocSpec.swf.zip
读取这些格式时,XDocIO会将它们转换为XDOC,我们仅需要对付这个简单XML就可以了。
输出这些格式时,我们仅需要生成XDOC的XML就可以了,剩下的事情交给XDocIO处理。
XDocIO目前支持的读取格式有:
xdoc, doc, docx, epub, rtf, html, htm, txt, ppt, pptx, xls, xlsx, zip, pdf, jar, jpd, csv
写入格式有: xdoc,pdf,docx,zip,epub,jar,jpd,rtf,xls,ppt,csv,txt,htm,mht,swf,emf,svg,ps,gif,jpg,png,xaml
它的读写格式是可扩展的,你可以实现自己的文档格式接口,或者覆盖已有的文档接口实现。
XDocIO的使用很简单
如果你是在Java中使用它,恭喜你,你可以直接使用它的程序库。非Java应用也不用灰心,你可以部署XDocServer,以服务的方式来使用它(当然Java也可以用这种方式)。
程序库
名称 | 用途 | 下载地址 |
hg.jar | 主程序库(必须) | |
fgio.jar | 输出swf、svg、emf、ps | |
itext.jar | 输出pdf、rtf | |
poi.jar | 读取doc、输出xls、ppt |
API文档
http://www.hgsql.com/XDocApi/index.html
命令行方式调用
java -classpath "hg.jar" com.hg.xdoc.XDocIO <源url> <目标文件>
如:java -classpath "hg.jar" com.hg.xdoc.XDocIO http://www.hgsql.com hgsql.docx
XDocServer方式见:http://www.hgsql.com/server.asp