OFFICE 文档在线预览方案不少:html
服务器先转换为PDF,再转换为SWF,最后经过网页加载Flash预览,好比flexpaper
Office文档直接转换为SWF,经过网页加载Flash预览
微软的Office365
在浏览器中直接打开
转换为html
今天,咱们要用的方案是转换为html来预览。java
技术方案:python
office文档转换为pdf:使用libreoffice
pdf转html,使用pdf2htmlex
测试环境:
操做系统:ubuntu 12.04git
1. office文档转pdf
1.1 安装libreoffice
apt-get install libreoffice-common
1.2 启动转换服务
soffice --accept="socket,host=127.0.0.1,port=2002;urp;" --nofirststartwizard
1.3 文档转换
网上通常介绍的都是使用JODConverter ,经过java来调用转换服务,其实还有一种替代方案,就是使用pyodconverter,python版本的转换脚本https://github.com/mirkonasato/pyodconverter/github
下载后,进行测试:ubuntu
python DocumentConverter.py Website_Information_Form.doc new.pdf
soffice