轻松实现各种文档格式转换,doc转pdf、doc转png图片、pdf转png图片,可以实现Windows、Linux、MacOS平台上部署,可以通过命令行、shell脚本、python等方式调用。
实现效果:已经可以通过一个函数方法进行调用实现各种文档的转换,下个版本会开发支持 web api 方式调用,以支持不同语言的交互调用。
一、原理
目前市面上有很多成熟的产品可以实现这样的功能,比如 wps 等相关产品,它可以把word文档转换为pdf、图片、text等格式,有些功能需要会员才能使用,但是这些都不是公开源码的,毕竟人家是要用来获取收益的。
但是上面的这些产品,不方便进行批量转换,确切的说,不方便我们集成到系统中进行智能使用。要通过代码实现文档格式的转化,需要做一些工作才能实现,比较简单的方式是通过调用Windows系统上的组件进行实现,网上有很多的例子都是通过基于Windows平台进行简单的实现。但是程序一般部署在Linux系统上,这就导致了很多不便。
本次介绍的方案也是通过调用第三方库实现的,其背景也是来自一个用户的需求,需要把数据库的数据批量生成海报,批量把word文档内容生成海报。 这里的第三方库主要是liboffice,通过对其方法的调用,并通过外部方法的完善,最后进行封装&#