office文档转html,OFFICE 文档转换为html在线预览

@H_404_0@OFFICE 文档在线预览方案很多:

服务器先转换为PDF,再转换为SWF,最后通过网页加载Flash预览,比如flexpaper

Office文档直接转换为SWF,通过网页加载Flash预览

微软的Office365

在浏览器中直接打开

转换为html

@H_404_0@今天,我们要用的方案是转换为html来预览。

@H_404_0@技术方案:

office文档转换为pdf:使用libreoffice

pdf转html,使用pdf2htmlex

@H_404_0@测试环境:

操作系统:ubuntu 12.04

1. office文档转pdf

1.1 安装libreoffice

apt-get install libreoffice-common

1.2 启动转换服务

soffice --accept="socket,host=127.0.0.1,port=2002;urp;" --nofirststartwizard

1.3 文档转换

@H_404_0@网上一般介绍的都是使用JODConverter ,通过java来调用转换服务,其实还有一种替代方案,就是使用pyodconverter,python版本的转换脚本https://github.com/mirkonasato/pyodconverter/

@H_404_0@下载后,进行测试:

python DocumentConverter.py Website_Information_Form.doc new.pdf

@H_404_0@soffice 可以正常转换为pdf,但是中文显示为乱码

1.4 中文乱码问题修复

@H_404_0@google一下,乱码问题大概是字体缺失的问题,于是尝试将windows下的字体拷贝过去,复制windows下的字体到/usr/share/fonts下,然后刷新字体缓存

sudo fc-cache -fv 2>&1 | grep Failed | cut -f1 -d":" | xargs -i sudo touch {} && sudo fc-cache -fv

@H_404_0@再重启转换服务,再次测试,已经OK了!

2.pdf转html

@H_404_0@pdf转html,使用国人开源的pdf2htmlex,一开始尝试通过源码编译安装,依赖组件太多,安装非常麻烦!感兴趣的可以执行编译安装,参见(https://github.com/coolwanglu/pdf2htmlEX/wiki/Building)

@H_404_0@下面介绍简单安装方式:

2.1 通过apt安装

sudo add-apt-repository ppa:coolwanglu/pdf2htmlex

sudo apt-get update

sudo apt-get install pdf2htmlex

2.2 测试pdf2htmlex

pdf2htmlEX --zoom 1.3 xiaoshujiang.pdf

@H_404_0@可以看到,当前目录生成了xiaoshujiang.html

2.3 转换脚本

@H_404_0@写一个脚本,将两次转换放到一起,方便调用:

#convert2html.sh

temp=$(date +%Y%m%d%H%m%s)

python DocumentConverter.py $1 ${temp}.pdf

pdf2htmlEX --zoom 1.3 $temp.pdf

mv $temp.html $2

rm $temp.pdf

3. 测试

3.1 word (doc.docx)测试

convert2html.sh imo云办公室-私有云用户使用手册V2.0.doc imo-doc.html

@H_404_0@404_0@

6c1ea7c900fb98c112c9bac8357de156.png

3.2 表格 (xls)测试

convert2html.sh xxx.xlsx xxx.html

@H_404_0@

674b9f4aac2681ab9fc68a22177d7dfa.png

3.3 PPT (pptx)测试

./convert.sh xxx.pptx xxx.html

@H_404_0@

be523a894dc909082a34d8b32ab5e33b.png

4. 总结

@H_404_0@本文介绍了一种在服务端将office文档转换为html以方便预览的方法。

@H_404_0@实际使用时,可以将生成好的html放到网站路径下,通过拦截器,设置访问权限。

总结

如果觉得编程之家网站内容还不错,欢迎将编程之家网站推荐给程序员好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。

小编个人微信号 jb51ccc

喜欢与人分享编程技术与工作经验,欢迎加入编程之家官方交流群!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值