由于在工作中使用到了PDF->TIFF的技术,所以稍微研究了一下实现方式,通过资料查阅,暂时发现了2种方式,2种方式有所区别:第一种方式转化后的tiff文件是黑白的,第二种方式转化后的tiff文件是有色彩的(跟PDF文件相同),如果不对色彩要求严格的话,建议使用第一种方式,因为转化的文件较小。
第一种PDF转化TIFF的方式(黑白):
注意主要依赖pdfbox的版本是1.8.9,而新版本的依赖不适用,例如2.0.0-RC2。
org.apache.pdfbox
pdfbox
1.8.9
compile
/*** 把PDF读入输入流,转化每一页为TIF
*@paraminputStream PDF输入流
*@paramdir 存放的路径
*@paramdpi dpi
*@return转化后的tif文件列表*/
public List pdf2tif(InputStream inputStream, File dir, int dpi) {
try (PDDocument pdf = PDDocument.load(inputStream)) {
BufferedImage[] images = new BufferedImage[pdf.getNumberOfPages()];
List files = new ArrayList<>();
long suffix = System.currentTimeMillis();
for (int i = 0; i < images.length; i++) {
PDPage page = (PDPage) pdf.getDocumentCatalog().getAllPages().get(i);
BufferedImage image;
image = page.convertToImage(BufferedImage.TYPE_BYTE_BINARY, dpi);
images[i] = image;
File file = new File(dir.getAbsolutePath() + File.separator + suffix + "-" + (i + 1) + ".tiff");
try (FileOutputStream out = new FileOutputStream(file);ImageOutputStream ios = ImageIO.createImageOutputStream(out)) {
TIFFImageWriterSpi tiffWriter = new TIFFImageWriterSpi();
ImageWriter writer = tiffWriter.createWriterInstance();
ImageWriteParam param = writer.getDefaultWriteParam();
ImageTypeSpecifier typeSpecifier = ImageTypeSpecifier.createFromBufferedImageType(BufferedImage.TYPE_INT_ARGB);
param.setCompressionMode(ImageWriteParam.MODE_EXPLICIT);
param.setCompressionType("CCITT T.6");
param.setCompressionQuality(1);
IIOMetadata metadata = writer.getDefaultImageMetadata(typeSpecifier, param);
IIOMetadataNode hps = new IIOMetadataNode("HorizontalPixelSize");
hps.setAttribute("value", Double.toString(1d / 300d * 25.4d));
IIOMetadataNode vps = new IIOMetadataNode("VerticalPixelSize");
vps.setAttribute("value", Double.toString(1d / 300d * 25.4d));
IIOMetadataNode dim = new IIOMetadataNode("Dimension");
dim.appendChild(hps);
dim.appendChild(vps);
IIOMetadataNode root = new IIOMetadataNode("javax_imageio_1.0");
root.appendChild(dim);
metadata.mergeTree("javax_imageio_1.0", root);
writer.setOutput(ios);
writer.write(metadata, new IIOImage(image, null, metadata), param);
} catch (IOException e) {
e.printStackTrace();
}
files.add(file);
System.out.println(file.getAbsolutePath());
}
return files;
} catch (IOException e) {
e.printStackTrace();
return null;
}
}
第二种PDF转化TIFF文件的方式(有色彩):
注意主要的依赖:(maven可能拉不下来,建议去网上下载)
com.sun.media
jai_codec
1.1-mr
javax.media
jai_core
1.1-mr
com.sun.medialib
mlibwrapper_jar
1.1
org.apache.pdfbox
pdfbox
2.0.0-RC2
/*** 从输入流读取pdf,转化为tiff后写入输出流.
*@paramis 输入流,提供pfg内容.
*@paramoutPath 输出目录.*/
public static Listpdf2Tiff(InputStream is, String outPath) {
PDDocument doc= null;
FileOutputStream fos= null;
List files = new ArrayList<>();try{
doc=PDDocument.load(is);int pageCount =doc.getNumberOfPages();
PDFRenderer renderer= new PDFRenderer(doc); //根据PDDocument对象创建pdf渲染器
List piList = new ArrayList(pageCount - 1);
TIFFEncodeParam param= new TIFFEncodeParam();//创建tiff编码参数类
param.setCompression(TIFFEncodeParam.COMPRESSION_DEFLATE);//压缩参数
param.setExtraImages(piList.iterator());//设置图片的迭代器
for (int i = 0; i < pageCount; i++) {
BufferedImage fimg=renderer.renderImageWithDPI(i, DPI, ImageType.RGB);
PlanarImage fpi= JAI.create("mosaic", fimg); //通过JAI的create()方法实例化jai的图片对象
File file = new File(outPath + (i + 1) + ".tiff");
fos= newFileOutputStream(file);
ImageEncoder enc= ImageCodec.createImageEncoder("tiff", fos, param);
enc.encode(fpi);//指定第一个进行编码的jai图片对象,并将输出写入到与此
files.add(file);if (fos !=null) {
fos.close();
}
}
}catch(IOException e) {
e.printStackTrace();
}finally{try{if (doc != null)
doc.close();
}catch(IOException e) {
e.printStackTrace();
}
}returnfiles;
}
注意:第二种方式可能会报错(有关JAI的错误),但是不影响程序正常运行,也不影响结果。可通过配置VM options参数来解决:-Dcom.sun.media.jai.disableMediaLib=true。
如果开发工具是IDEA可在Configuration中的VM options栏添加:-Dcom.sun.media.jai.disableMediaLib=true。如图: