阅读大量文章,在分拆扫描件pdf情况对比如下:
php分拆扫描件pdf很难,用Smalot\PdfParser是分拆不了pdf扫描件。那么用itextpdf呢?php没有直接插件去调用itextpdf,如果需要则通过 PHP / Java Bridge ,但是搭建桥接也是一门很深奥的技术。所以一个字,难!
java开发分拆扫描件pdf,这个很好实用itext,只要在pom.xml中加入:
com.itextpdf
itextpdf
5.5.13
代码实现可以:
PdfReader reader;
try {
reader = new PdfReader(filename);
} catch (IOException e) {
throw new Exception(“读取PDF文件失败”);
}
int numberOfPages = reader.getNumberOfPages();
Document doc = new Document();
PdfCopy pdfCopy;
try {
pdfCopy = new PdfCopy(doc, new FileOutputStream(splitFileName));
} catch (FileNotFoundException | DocumentException e) {
throw new Exception("切割文件副本创建失败");
}
具体实现可以查看很多读取itextpdf内容文章,不一一讲解。
那么php一定要实用itextpdf呢?
这就是我要讲的重点,先用java开发itextpdf,对代码进行实现,然后用Restful进行接口开发,java对扫描件pdf进行分拆,php已Restful接口模式调用,这双方都实现简单化!