对比这几款开源项目PDFRenderer、pdfbox、jpedal 的做法:
1.PDFRenderer: 确实效率最高,但是缺少字体支持对大多数中文pdf处理不了(很奇怪为什么项目组还没做默认字体支持)
2.pdfbox:字体基本都可以转换,但容易内存溢出(我搞了几十M文件就不行了)
3.jpedal:效率不错。不过我这里好几个中文pdf文件就是生成缩略图不对,我还向项目组提bug了
没有办法,在目前我遇到字体解决不了情况,我寻找到了ICEPDF,这个项目也有商业和开源的。我用了开源的ICEPDF-4.2.2 (最新有4.3了),它其实用了jpedal的字体支持库,确能支持我手上的中文pdf,而且效率不错(测试没遇到内存溢出)。使用比较方便,这里把代码贴在这里:
01 | public static final String FILETYPE_JPG = "jpg" ; |
02 | public static final String SUFF_IMAGE = "." + FILETYPE_JPG; |
05 | * 将指定pdf文件的首页转换为指定路径的缩略图 |
06 | *@param filepath 原文件路径,例如d:/test.pdf |
07 | *@param imagepath 图片生成路径,例如 d:/test-1.jpg |
08 | *@param zoom 缩略图显示倍数,1表示不缩放,0.3则缩小到30% |
10 | public static void tranfer(String filepath, String imagepath, float zoom) |
11 | throws PDFException, PDFSecurityException, IOException { |
13 | Document document = null ; |
17 | document = new Document(); |
18 | document.setFile(filepath); |
21 | BufferedImage img = (BufferedImage) document.getPageImage( 0 , |
22 | GraphicsRenderingHints.SCREEN, Page.BOUNDARY_CROPBOX, rotation, |
25 | Iterator iter = ImageIO.getImageWritersBySuffix(FILETYPE_JPG); |
26 | ImageWriter writer = (ImageWriter) iter.next(); |
27 | File outFile = new File(imagepath); |
28 | FileOutputStream out = new FileOutputStream(outFile); |
29 | ImageOutputStream outImage = ImageIO.createImageOutputStream(out); |
30 | writer.setOutput(outImage); |
31 | writer.write( new IIOImage(img, null , null )); |