1、pdf2htmlEX介绍
一般发布的call表的文件类型是pdf,但是为了配合移动端的显示需求,需要将这些pdf文件转换成html文件,然后在移动端展示出来(目前只有安卓端所以就是用webview),为了实现pdf文件转换html文件,CAE引入了pdf2htmlEX的第三方软件来实现。
pdf2htmlEX是一个专门用来转换pdf到html的软件,它的使用方法也比较简单,只需要在命令行进入安装目录,然后输入“pdf2html <pdf文件路径> <html文件路径>”即可简单使用,当然它还提供了一系列的可选参数,目前CAE都不会用到这些参数,仅仅是简单地使用它来转换pdf,所以这里不再阐述过多的可选参数。
但是单纯通过命令行使用pdf2htmlEX有一个很大的弊端,那就是一次只能转换一个pdf,它没有提供批量操作的功能,如果一个一个pdf地转换就要编写多次命令,这样既费时费力,也不够优雅。因此,现考虑通过使用java来调用命令行的方式来实现批量操作,其实就是读取一个文件夹下的所有pdf文件,然后一个循环调用pdf2htmlEX即可完成。
但是单纯地循环调用还有一个问题需要解决,问题是出于pdf2htmlEX的单次转换运行时间,转换一个pdf其实是需要比较久的时间的,大概会有几秒,一旦转换的call表文件多起来的话,每个pdf都需要几秒,那么总共加起来的时间就比较长了。pdf2htmlEX的单次转换运行时间是取决于pdf2htmlEX内核的算法的,这个目前还无法优化,且难度较大,所以可以将其看作不可优化项,所以优化点就在于java调用pdf2htmlEX的方式。为了充分利用机器资源,现考虑使用线程池来并发调用pdf2htmlEX来提高性能。