java简易替换pdf中的文本内容

最新推荐文章于 2025-04-30 11:28:26 发布

nayi_224

最新推荐文章于 2025-04-30 11:28:26 发布

阅读量633

点赞数 1

文章标签： java pdf

本文链接：https://blog.csdn.net/nayi_224/article/details/144428643

版权

替换的方法有很多，但是大多都比较繁琐，我只想做最简单的字符串替换，并不想关注定位、字体这些。
本文只演示一种使用spire.pdf.free的简单场景

spire.pdf是付费的，但是也提供了免费版，功能足够处理简单场景
友情提示: 免费版有 10 页的页数输出限制，在输出结果文档时只能输出前 10 页。将 PDF 文档转换为图片、Word、HTML、XPS 等格式时，仅支持转换前 3 页。如超出限制，可升级到商业版，我们仅对免费版进行不定期维护。免费版不提供技术服务或其他支持服务。
查看jar版本
https://repo.e-iceblue.cn/#browse/browse:maven-public:e-iceblue%2Fspire.pdf.free
尽量使用最新的，因为官方文档只有最新付费版的示例，并且很可能不适用于免费版的历史版本
maven引用

  	<repositories>
        <repository>
            <id>com.e-iceblue</id>
            <url>https://repo.e-iceblue.cn/repository/maven-public/</url>
        </repository>
    </repositories>
    <dependencies>
        <dependency>
	    	<groupId>e-iceblue</groupId>
	    	<artifactId>spire.pdf.free</artifactId>
	   	 	<version>9.13.0</version>
		</dependency>
	</dependencies>

代码示例

import com.spire.pdf.PdfDocument;
import com.spire.pdf.PdfPageBase;
import com.spire.pdf.texts.PdfTextReplaceOptions;
import com.spire.pdf.texts.PdfTextReplacer;
import com.spire.pdf.texts.ReplaceActionType;
import java.util.EnumSet;

public class ReplaceTextInPage {

	public static void main(String[] args) {
		PdfDocument doc = new PdfDocument();

		doc.loadFromFile("D:/workspace/mytest/test.pdf");

		PdfTextReplaceOptions textReplaceOptions = new PdfTextReplaceOptions();

		// 指定文本替换的选项
		textReplaceOptions.setReplaceType(EnumSet.of(ReplaceActionType.IgnoreCase));
		textReplaceOptions.setReplaceType(EnumSet.of(ReplaceActionType.WholeWord));

		for (int i = 0; i < doc.getPages().getCount(); i++) {
			PdfPageBase page = doc.getPages().get(i);

			// 根据页面创建一个PdfTextReplacer对象
			PdfTextReplacer textReplacer = new PdfTextReplacer(page);

			// 设置替换选项
			textReplacer.setOptions(textReplaceOptions);

			// 将所有目标文本实例替换为新文本
			textReplacer.replaceAllText("aaa", "bbb");
			//
		}

		doc.saveToFile("out3.pdf");
		doc.dispose();
	}

}