使用PDFBox实现pdf转其他图片格式

最近在做一个小项目,项目中有一个功能要把pdf格式的图片转换为其它格式,接下来看看用pdfbox来如何实现吧。

首先导入pdfbox相关依赖:

 <dependency> 
         <groupId>org.apache.pdfbox</groupId> 
         <artifactId>pdfbox</artifactId> 
         <version>2.0.1</version> 
      </dependency>   

      <dependency> 
         <groupId>org.apache.pdfbox</groupId> 
         <artifactId>fontbox</artifactId> 
         <version>2.0.0</version> 
      </dependency>

      <dependency>  
         <groupId>org.apache.pdfbox</groupId> 
         <artifactId>jempbox</artifactId> 
         <version>1.8.11</version> 
      </dependency> 

      <dependency>
         <groupId>org.apache.pdfbox</groupId> 
         <artifactId>xmpbox</artifactId> 
         <version>2.0.0</version> 
      </dependency> 

      <dependency> 
         <groupId>org.apache.pdfbox</groupId> 
         <artifactId>preflight</artifactId> 
         <version>2.0.0</version> 
      </dependency> 

      <dependency> 
         <groupId>org.apache.pdfbox</groupId> 
         <artifactId>pdfbox-tools</artifactId> 
         <version>2.0.0</version> 
      </dependency>


接下来,控制层里面写一个方法接收三个参数(其中三个参数分别表示上传的文件,要转换的格式,输出路径):

  @ApiOperation("将pdf格式的图片装换为其它格式")
    @PostMapping("/pdfToimages")
    public R pdfToimages(@RequestPart("file") MultipartFile file
            , @RequestParam("type") String type,@RequestParam(value = "outpath",defaultValue = "C:\\PictureTool",required = false) String outpath){
        return  imagetoolService.convertToImages(file,type,outpath);
    }

然后是serviceimpl实现层实现对应方法(service接口此处就不做展示了,直接将serviceimpl里面的对应的方法设置为接口就行了):

/**
     * pdf转多张jpg(转换成多张图片)
     *
     * @param file
     * @return
     */
    @Override
    public R convertToImages(MultipartFile file, String type, String outputPath) {
        if (file == null || file.isEmpty() || outputPath == null || outputPath.trim().isEmpty()) {
            // 对传入参数进行基本校验,确保它们不为空
            return R.Failed("请确保文件不为空且输出路径不为空。");
        }
//        获取文件名
        String filename = file.getOriginalFilename();
        int lastIndexOfDot = filename.lastIndexOf(".");
        if (lastIndexOfDot != -1) {
            filename = filename.substring(0, lastIndexOfDot);
        }
        System.out.println("文件名称为:" + filename);

        // 确保路径以分隔符结尾
        if (!outputPath.endsWith(File.separator)) {
            outputPath += File.separator;
        }

        try {
            // 加载PDF文件
            PDDocument document = PDDocument.load(file.getBytes());
            // 创建PDF渲染器
            PDFRenderer pdfRenderer = new PDFRenderer(document);

            // 使用ByteArrayOutputStream来构建ZIP文件的内容
            ByteArrayOutputStream baosZip = new ByteArrayOutputStream();
            ZipOutputStream zipOut = new ZipOutputStream(baosZip);

            // 遍历PDF中的每一页,并将其添加到ZIP流中
            for (int page = 0; page < document.getNumberOfPages(); page++) {
                // 使用300 DPI渲染图片
                BufferedImage image = pdfRenderer.renderImageWithDPI(page, 300, ImageType.RGB);
                // 创建输出流缓存图像数据
                ByteArrayOutputStream baosImage = new ByteArrayOutputStream();
                // 保存图片到缓存流
                ImageIO.write(image, type, baosImage);
                // 将图像字节添加到ZIP文件中
                zipOut.putNextEntry(new ZipEntry(file.getOriginalFilename() + "_page_" + (page + 1) + "." + type));
                zipOut.write(baosImage.toByteArray());
                zipOut.closeEntry();
            }

            // 完成ZIP输出流写入操作并关闭之
            IOUtils.closeQuietly(zipOut);

            // 关闭PDF文档
            IOUtils.closeQuietly(document);

            // 创建用户指定的文件,用于保存ZIP
            String zipFilename = filename + "_converted_images_" + type + ".zip";
            File outputFile = new File(outputPath + zipFilename);
            FileUtils.writeByteArrayToFile(outputFile, baosZip.toByteArray());

            // 返回成功的状态响应
            return R.Success("转换成功,保存路径为:" + outputFile.getAbsolutePath(), 200);

        } catch (IOException e) {
            // 发生异常时打印堆栈跟踪并返回错误信息
            e.printStackTrace();
            return R.Failed(500, "转换失败:" + e.getMessage());
        }
    }

此处的R是我自己做的一个返回响应类,读者可以根据自己项目的实际情况设置自己的响应类,或者后台私信我获取,代码中均做有注释,若有疑问之处请留言~

项目成功运行之后会根据指定文件名的生成规则生成一个压缩包到指定的文件中,若没有指定文件则会用默认的文件生成路径。

接下来使用postman进行运行:

运行成功后,便可以在对应文件夹下面查看对应生成成功的文件:

后面直接将文件解压缩即可~

  • 6
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
Java 通过 pdfbox 库可以实现图片 PDF 的功能,同时也可以通过该库对 PDF 中的图片进行压缩。以下是一个示例代码: ```java import org.apache.pdfbox.pdmodel.PDDocument; import org.apache.pdfbox.pdmodel.PDPage; import org.apache.pdfbox.pdmodel.graphics.image.JPEGFactory; import org.apache.pdfbox.pdmodel.graphics.image.PDImageXObject; import java.io.File; import java.io.IOException; public class ImageToPdf { public static void main(String[] args) throws IOException { // 创建一个空白的PDF文档 PDDocument document = new PDDocument(); // 加载要换为PDF图片文件 File imageFile = new File("image.jpg"); // 创建一个页面对象 PDPage page = new PDPage(); // 将图片换为PDF图像对象 PDImageXObject image = JPEGFactory.createFromImage(document, ImageIO.read(imageFile), 0.5f); // 在页面上添加图像 page.getCropBox(); page.setMediaBox(image.getCropBox()); page.setRotation(0); page.setArtBox(image.getCropBox()); page.setBleedBox(image.getCropBox()); page.setTrimBox(image.getCropBox()); PDPageContentStream contentStream = new PDPageContentStream(document, page); contentStream.drawImage(image, 0, 0); // 关闭页面内容流 contentStream.close(); // 将页面添加到文档中 document.addPage(page); // 保存PDF文件 document.save("image.pdf"); // 关闭PDF文档 document.close(); } } ``` 如果需要在压缩 PDF 中的图片,可以使用下面的代码对 PDF 中的所有图片进行压缩: ```java import org.apache.pdfbox.cos.COSName; import org.apache.pdfbox.pdmodel.PDDocument; import org.apache.pdfbox.pdmodel.PDPage; import org.apache.pdfbox.pdmodel.graphics.image.PDImageXObject; import org.apache.pdfbox.pdmodel.graphics.image.JPEGFactory; import org.apache.pdfbox.pdmodel.graphics.image.LosslessFactory; import org.apache.pdfbox.pdmodel.graphics.image.PDImageXObject; import org.apache.pdfbox.pdmodel.graphics.image.PDImageXObject; import org.apache.pdfbox.pdmodel.graphics.image.PDImageXObject; import java.io.File; import java.io.IOException; public class CompressPdfImages { public static void main(String[] args) throws IOException { // 加载PDF文件 PDDocument document = PDDocument.load(new File("input.pdf")); // 遍历所有页面 for (PDPage page : document.getPages()) { // 获取页面中的所有图像 for (PDImageXObject image : page.getResources().getXObjectNames().stream() .map(x -> page.getResources().getXObject((COSName) x)) .filter(x -> x instanceof PDImageXObject) .map(x -> (PDImageXObject) x) .toArray(PDImageXObject[]::new)) { // 如果图像是JPEG格式,则进行压缩 if ("jpg".equals(image.getSuffix())) { PDImageXObject compressedImage = JPEGFactory.createFromImage(document, image.getImage(), 0.5f); page.getResources().add(compressedImage); page.getResources().remove(image.getName()); } // 如果图像是PNG格式,则进行压缩 else if ("png".equals(image.getSuffix())) { PDImageXObject compressedImage = LosslessFactory.createFromImage(document, image.getImage(), 0.5f); page.getResources().add(compressedImage); page.getResources().remove(image.getName()); } } } // 保存压缩后的PDF文件 document.save("output.pdf"); // 关闭PDF文档 document.close(); } } ``` 如果需要将多个 PDF 文件合并为一个 PDF 文件,可以使用下面的代码: ```java import org.apache.pdfbox.multipdf.PDFMergerUtility; import java.io.File; import java.io.IOException; public class MergePdfFiles { public static void main(String[] args) throws IOException { // 创建一个PDF合并工具对象 PDFMergerUtility merger = new PDFMergerUtility(); // 添加要合并的PDF文件 merger.addSource(new File("file1.pdf")); merger.addSource(new File("file2.pdf")); merger.addSource(new File("file3.pdf")); // 合并PDF文件 merger.setDestinationFileName("merged.pdf"); merger.mergeDocuments(null); } } ``` 以上是 Java 中使用 pdfbox实现图片 PDF、压缩 PDF图片、合并多个 PDF 文件为一个 PDF 文件的示例代码。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

银氨溶液

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值