最近项目里面有个需求,要求按照单位汇总所有的上报材料,最终全部导出为一本PDF格式的电子书
我查看了很多资料,最终决定使用openoffice+pdfbox两种插件的组合,去实现多个word文件转换为一个PDF文件(ppt、excel都可以转换)的功能。
开始想使用poi+itext的方案,但是看了实现的原理,决定放弃此方法,因为poi首先把word读为流写成HTML文件,在这个过程中,word所有的格式都丢失了,再去做转换的工作都已经是没有意义了。所以采用poi就是一个不好的思路。
一下说一说这种方案的实现原理:openoffice负责把word转换为pdf,pdfbox负责把多个pdf文件合并为一个。
具体实现步骤:
1 需要安装的软件:
OpenOffice 下载地址http://www.openoffice.org/
JodConverter 下载地址http://sourceforge.net/projects/jodconverter/files/JODConverter/,