Java pdfbox pdf转成base64数组

maven

<dependency>
    <groupId>org.apache.pdfbox</groupId>
    <artifactId>pdfbox</artifactId>
    <version>2.0.23</version>
</dependency>
<dependency>
    <groupId>com.itextpdf</groupId>
    <artifactId>itextpdf</artifactId>
    <version>5.5.0</version>
</dependency>

public static ArrayList<String> pdfToImg(String PdfFilePath, int dpi) {
    ArrayList<String> pdfBase64 = new ArrayList<String>();
    File file = new File(PdfFilePath);
    PDDocument pdDocument;
    try {
        pdDocument = PDDocument.load(file);
        PDFRenderer renderer = new PDFRenderer(pdDocument);
        /* dpi越大转换后越清晰,相对转换速度越慢 */
        PdfReader reader = new PdfReader(PdfFilePath);
        int pages = reader.getNumberOfPages();
        for (int i = 0; i < pages; i++) {
            BufferedImage image = renderer.renderImageWithDPI(i, dpi);
            ByteArrayOutputStream out = new ByteArrayOutputStream();
            ImageIO.write(image, "png", out);
            byte[] bytes = out.toByteArray();//转换成字节
            BASE64Encoder encoder = new BASE64Encoder();
            String png_base64 = encoder.encodeBuffer(bytes).trim();//转换成base64串
            png_base64 = png_base64.replaceAll("\n", "").replaceAll("\r", "");//删除 \r\n
            pdfBase64.add(png_base64);
        }

    } catch (IOException e) {
        e.printStackTrace();
    }
    return pdfBase64;
}

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
PDFBox是一个用于处理PDF文件的Java库,它提供了一系列的API,可以用来读取、创建和修改PDF文件。虽然PDFBox本身并不直接支持将PDF换为Word文档,但可以通过其他方式实现这个功能。 一种常见的方法是使用PDFBox读取PDF文件的内容,并将其换为纯文本格式。然后,可以使用Apache POI或其他类似的库来创建一个新的Word文档,并将纯文本内容写入其中。 以下是一个简单的示例代码,演示了如何使用PDFBox和Apache POI将PDF换为Word文档: ```java import org.apache.pdfbox.pdmodel.PDDocument; import org.apache.pdfbox.text.PDFTextStripper; import org.apache.poi.xwpf.usermodel.XWPFDocument; import org.apache.poi.xwpf.usermodel.XWPFParagraph; import org.apache.poi.xwpf.usermodel.XWPFRun; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; public class PDFToWordConverter { public static void main(String[] args) { try { // 加载PDF文件 PDDocument document = PDDocument.load(new FileInputStream("input.pdf")); // 创建Word文档 XWPFDocument wordDocument = new XWPFDocument(); // 提取PDF内容 PDFTextStripper stripper = new PDFTextStripper(); String text = stripper.getText(document); // 将内容写入Word文档 XWPFParagraph paragraph = wordDocument.createParagraph(); XWPFRun run = paragraph.createRun(); run.setText(text); // 保存Word文档 FileOutputStream out = new FileOutputStream("output.docx"); wordDocument.write(out); out.close(); // 关闭PDF文档 document.close(); System.out.println("PDF换为Word成功!"); } catch (IOException e) { e.printStackTrace(); } } } ``` 请注意,这只是一个简单的示例,实际应用中可能需要更复杂的处理逻辑和错误处理。另外,换的结果可能会因PDF文件的结构和格式而有所差异。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值