使用spire.pdf往某个位置处写文本信息

使用开发工具idea2022,java1.8版本,利用spire.pdf往一个现成的pdf中写入文本信息,经过一番研究,实现了,现在贴出代码分享:

首先导入Spire.Pdf.jar到maven汇总,因为我采用他的官网在pom中加依赖老是失败,所以就直接下载了jar包,然后导入到程序中,jar下载链接如下:

(179条消息) spire.pdf-FE-5.1.0.ZIP-Java文档类资源-CSDN文库icon-default.png?t=M85Bhttps://download.csdn.net/download/qq_34309663/87258972

思路:

找到你需要写入的文本旁边的一个关键信息,然后计算那个关键信息的坐标,稍微加一些偏移,就完成了:你需要先提供好一个需要操作的pdf文档

import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;

import com.spire.pdf.*;
import com.spire.pdf.PdfDocument;
import com.spire.pdf.general.find.*;
import com.spire.pdf.graphics.*;
import java.awt.*;
import java.awt.geom.Rectangle2D;
/*获取冰蓝spire.pdf某个文字坐标系的方法
txt:某个需要找到的文字坐标
newText:某个需要写入的内容
原理为找到txt所在的坐标,适当做一些偏移,就可以写入新的内容了
 */
private static void replaceTxt(String txt,String newText){


    //创建 PdfDocument 类的对象
    PdfDocument doc = new PdfDocument();

    //载入PDF文档
    doc.loadFromFile("E:\\check.pdf");

    //获取文档的第一页
    PdfPageBase page = doc.getPages().get(0);

    //搜索需要替换的旧文本
    PdfTextFindCollection collection = page.findText(txt,false);


    //创建 PdfTrueTypeFont 类的对象以设置字体
    PdfTrueTypeFont font = new PdfTrueTypeFont(new Font("华文中宋",  Font.PLAIN, 12));

    PdfTextFind findObj=collection.getFinds()[0];
    Rectangle2D.Float rec = (Rectangle2D.Float) findObj.getBounds();

    //page.getCanvas().drawRectangle(PdfBrushes.getWhite(), rec);//此处会将找到的地方刷白,覆盖掉

    //绘制文本
    page.getCanvas().drawString(newText, font, PdfBrushes.getBlack(), rec.getX()+50, rec.getY() - 3);


    String result = "E:\\check666.pdf";

    //保存文档
    doc.saveToFile(result, FileFormat.PDF);
}

写入前:

写入后:

 

 

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
spire.pdf是一个用于处理PDF文件的开源库,可用于提取PDF文档中的文本内容和坐标。 要获取文本的坐标,我们需要使用spire.pdf的相关方法和属性。首先,我们需要加载PDF文件,使用PdfDocument类的loadFromFile方法或loadFromStream方法来加载文件。 一旦加载了PDF文件,我们可以通过getPageCount方法获取PDF文件的总页数。然后,我们可以使用getPage方法来获取指定页数的PdfPage对象。 对于每一页,我们可以使用getPageContent方法来获取页面内容的字符串表示。然后,我们可以使用正则表达式或其他文本处理方法来提取文本坐标。根据PDF文件的结构,文本通常包含在Td、TD和TJ操作符中。这些操作符提供了文本字符串和坐标的信息。 我们可以使用正则表达式来匹配这些操作符,并提取坐标信息。例如,我们可以使用表达式"/(Td|TD|TJ)\s*?([\-0-9]+\s*?)+?/"来匹配这些操作符,并提取坐标信息。 在提取坐标信息后,我们可以将其存储到一个数据结构中,如List或数组。这样,我们就可以对PDF文件中的文本进行进一步的操作,如分析、搜索或渲染。 需要注意的是,PDF文件的结构复杂,提取文本坐标可能涉及到一些细节和特殊情况的处理。因此,我们需要了解PDF文件的结构和spire.pdf库的使用方法,以便准确地提取文本坐标。 总之,通过使用spire.pdf库,我们可以加载PDF文件并提取文本坐标。我们可以使用正则表达式或其他文本处理方法来匹配文本操作符,并提取坐标信息。这样,我们就可以对PDF文件中的文本进行有针对性的处理和分析。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值