【java】java实现pdf根据内容定位插入图片

最新推荐文章于 2024-05-28 17:12:00 发布

小依真

最新推荐文章于 2024-05-28 17:12:00 发布

阅读量1.9k

点赞数 3

分类专栏：开发 # java 文章标签： java 开发语言 jvm

本文链接：https://blog.csdn.net/weixin_43876557/article/details/126269866

版权

开发同时被 2 个专栏收录

15 篇文章 0 订阅

订阅专栏

java

10 篇文章 0 订阅

订阅专栏

java实现pdf根据内容定位插入图片

1.导入jar包

<dependency>
            <groupId>com.itextpdf</groupId>
            <artifactId>itext7-core</artifactId>
            <version>7.1.12</version>
            <type>pom</type>
        </dependency>

2.实现类

package test;


import com.itextpdf.io.image.ImageData;
import com.itextpdf.io.image.ImageDataFactory;
import com.itextpdf.kernel.geom.Rectangle;
import com.itextpdf.kernel.pdf.PdfDocument;
import com.itextpdf.kernel.pdf.PdfReader;
import com.itextpdf.kernel.pdf.PdfWriter;
import com.itextpdf.kernel.pdf.canvas.parser.PdfDocumentContentParser;
import com.itextpdf.kernel.pdf.canvas.parser.listener.IPdfTextLocation;
import com.itextpdf.kernel.pdf.canvas.parser.listener.RegexBasedLocationExtractionStrategy;
import com.itextpdf.layout.Document;
import com.itextpdf.layout.element.Image;



import java.util.Collection;

public class Test {
    public static void main(String[] args)  throws Exception {
        String input = "D:\\te1.pdf";
        //通过指定pdf文件名，指定关键字，和指定的pdf文件的待处理页数做参数
        getKeyWordsLocation(input, "甲方：", 1);

    }
    /**
     * 得到关键字位置
     * @param input 源文件
     * @param KEY_WORD 关键字
     * @param pageNum 文档页数
     */
    public static void getKeyWordsLocation(String input, String KEY_WORD, int pageNum) {
        RegexBasedLocationExtractionStrategy strategy = new RegexBasedLocationExtractionStrategy(KEY_WORD);
        try {
            //得到需要插入的图片
            ImageData imageData = ImageDataFactory.create("D:\\1.jpg");
            //核心思路为对PdfDocument对象采用某种Strategy，这里使用RegexBasedLocationExtractionStrategy
            PdfReader pr = new PdfReader(input);
            //生成新的PDF文件
            PdfDocument pd = new PdfDocument(pr, new PdfWriter("D:\\test.pdf"));
            //pageNum = pd.getNumberOfPages();
            Document document = new Document(pd);
            PdfDocumentContentParser pdcp = new PdfDocumentContentParser(pd);
            //文本内容具体解析借助使用PdfDocumentContentParser类(实质使用PdfCanvasProcessor进行处理)， 对待处理页面装配合适策略
            RegexBasedLocationExtractionStrategy regexStrategy = pdcp.processContent(pageNum, strategy);
            //获取处理结果
            Collection<IPdfTextLocation> resultantLocations = strategy.getResultantLocations();
            //自定义结果处理
            if (!resultantLocations.isEmpty()) {
                for (IPdfTextLocation item : resultantLocations) {
                    Rectangle boundRectangle = item.getRectangle();
                    System.out.println(item.getText());
                    System.out.println("关键字“" + KEY_WORD + "” 的坐标为 x: " + boundRectangle.getX() + "  ,y: " + boundRectangle.getY());
                    Image image = new Image(imageData).scaleAbsolute(70, 20).setFixedPosition(pageNum, boundRectangle.getRight() + 5f, boundRectangle.getBottom());
                    document.add(image);
                }
                document.close();
            } else {
                System.out.println("结果为空");
            }
            pr.close();
            pd.close();
        } catch (Exception e) {
            System.err.println("读取文件失败!");
            e.printStackTrace();
        }
    }
    
}