采集PDF数据,替换word文字、图片

说明:最近来了一个脚本需求,老大给了我们一串解密代码,让我们将解密信息转存为一个模板word。

一、实现步骤

  1. 采集文字数据,储存到Map。(由于存在保密条款,采集数据部分代码不予展示)
  2. 写入文字到word。
  3. 获取PDF页码
  4. 转储页为临时图片文件
  5. 写入临时图片文件到word。
  6. 关闭相关IO操作,结束。

二、相关技术

  1. Java1.8
  2. 采集pdf文本、获取页码工具包 : itextpdf-5.5.13.3.jar(由于存在保密条款,部分代码不予展示)
  3. word文字图片替换处理包: 相关文档地址
        <!-- word处理包 -->
        <dependency>
            <groupId>com.deepoove</groupId>
            <artifactId>poi-tl</artifactId>
            <version>1.10.0</version>
        </dependency>
  1. PDF页码转图片处理包:包相关地址
        <!-- pdf处理包 -->
        <!-- https://mvnrepository.com/artifact/org.apache.pdfbox/pdfbox -->
        <dependency>
            <groupId>org.apache.pdfbox</groupId>
            <artifactId>pdfbox</artifactId>
            <version>2.0.29</version>
        </dependency>

三、相关实现函数

PDF页码转图片
 /**
     * pdf页转图片文件
     *
     * @param sourPdf pdf文件
     * @param dest    目的图片文件
     * @param index   页码
     * @return 目的图片文件
     * @throws IOException io
     */
    private static File writeTemp(String sourPdf, String dest, int index) throws IOException {
        PDDocument pdDocument = PDDocument.load(new File(sourPdf));
        PDFRenderer renderer = new PDFRenderer(pdDocument);
        File file = new File(dest);
        FileOutputStream os = new FileOutputStream(file);
        /* dpi越大转换后越清晰,相对转换速度越慢 */
        BufferedImage image = renderer.renderImage(index);
        ImageIO.write(image, "png", os);
        return file;
    }
填充word
    /**
     * 写入模板
     * @param params 参数 key为填充位
     * @param src 模板
     * @param dest 写入后的模板
     * @throws IOException io
     */
    private static void copyTempWrite(Map<String, Object> params, String src, String dest) throws IOException {
        XWPFTemplate template = XWPFTemplate.compile(src).render(params);
        template.writeAndClose(Files.newOutputStream(Paths.get(dest)));
    }
举例:
		// 文件
        File file0 = writeTemp(renderer, 0);
        params.put("img0", file0);
        // 文字参数
        LocalDate date = LocalDate.now();
        params.put("year", date.getYear());
        params.put("month", date.getMonth().getValue());
        params.put("day", date.getDayOfMonth());

四、解决问题、存在问题

解决问题:
  1. 采集PDF数据,替换word文字、图片
存在问题
  1. 必须通过临时文件转储图片
    可以使用java中的通道,达到无需临时文件中转的。但由于本次设计作为一个脚本,目的是尽快完成功能,所以并未完善。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

*crzep

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值