替换的方法有很多,但是大多都比较繁琐,我只想做最简单的字符串替换,并不想关注定位、字体这些。
本文只演示一种使用spire.pdf.free的简单场景
spire.pdf是付费的,但是也提供了免费版,功能足够处理简单场景
友情提示: 免费版有 10 页的页数输出限制,在输出结果文档时只能输出前 10 页。将 PDF 文档转换为图片、Word、HTML、XPS 等格式时,仅支持转换前 3 页。如超出限制,可升级到商业版,我们仅对免费版进行不定期维护。免费版不提供技术服务或其他支持服务。
查看jar版本
https://repo.e-iceblue.cn/#browse/browse:maven-public:e-iceblue%2Fspire.pdf.free
尽量使用最新的,因为官方文档只有最新付费版的示例,并且很可能不适用于免费版的历史版本
maven引用
<repositories>
<repository>
<id>com.e-iceblue</id>
<url>https://repo.e-iceblue.cn/repository/maven-public/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>e-iceblue</groupId>
<artifactId>spire.pdf.free</artifactId>
<version>9.13.0</version>
</dependency>
</dependencies>
代码示例
import com.spire.pdf.PdfDocument;
import com.spire.pdf.PdfPageBase;
import com.spire.pdf.texts.PdfTextReplaceOptions;
import com.spire.pdf.texts.PdfTextReplacer;
import com.spire.pdf.texts.ReplaceActionType;
import java.util.EnumSet;
public class ReplaceTextInPage {
public static void main(String[] args) {
PdfDocument doc = new PdfDocument();
doc.loadFromFile("D:/workspace/mytest/test.pdf");
PdfTextReplaceOptions textReplaceOptions = new PdfTextReplaceOptions();
// 指定文本替换的选项
textReplaceOptions.setReplaceType(EnumSet.of(ReplaceActionType.IgnoreCase));
textReplaceOptions.setReplaceType(EnumSet.of(ReplaceActionType.WholeWord));
for (int i = 0; i < doc.getPages().getCount(); i++) {
PdfPageBase page = doc.getPages().get(i);
// 根据页面创建一个PdfTextReplacer对象
PdfTextReplacer textReplacer = new PdfTextReplacer(page);
// 设置替换选项
textReplacer.setOptions(textReplaceOptions);
// 将所有目标文本实例替换为新文本
textReplacer.replaceAllText("aaa", "bbb");
//
}
doc.saveToFile("out3.pdf");
doc.dispose();
}
}
官方文档地址
https://www.e-iceblue.cn/pdf_java_text/find-and-replace-text-in-pdf-using-java.html