java PDFBOX(2.0.25) 修改文本内容

@[TOC](PDFBOX(2.0.25) 修改文本内容)

pdfbox文本内容修在网上找不到新版本的,老版本的还不兼容(无效)。经过几周的寻找终于找到了个能用的
PDFBOX替换文本(pdfbox版本2.0.24,虽然我自己也发现这个字符编码的没弄成,参考这个后终于搞好了😊太不容易了。
记录下 方便以后使用

@Test
	public void pdf() throws Exception {
		File file = ResourceUtils.getFile("classpath:5.pdf");
		PDDocument pd = PDDocument.load(file);
		// 需要的字体文件
		Map<COSName, PDFont> oldfont = new HashMap<COSName, PDFont>();
		COSName fontName = null;
		PDType0Font targetfont= PDType0Font.load(pd, new File("C:\\Windows\\Fonts\\simfang.ttf"));
		for (PDPage page : pd.getPages()) {
			PDFStreamParser pdfsp = new PDFStreamParser(page);
			pdfsp.parse();
			List<Object> tokens = pdfsp.getTokens();
            for (int j = 0; j < tokens.size(); j++) {
                //创建一个object对象去接收标记
                Object next = tokens.get( j );
                //instanceof判断其左边对象是否为其右边类的实例
                if(next  instanceof COSName) {
                	fontName= (COSName)next;
                	if(!oldfont.containsKey(fontName)) {
                		oldfont.put(fontName, page.getResources().getFont(fontName));
                	}
                }else 
                if(next  instanceof COSString) {
                    COSString previous = (COSString)next;
                    try(InputStream in = new ByteArrayInputStream(previous.getBytes())){
                    	StringBuffer sb = new StringBuffer();
                    	while (in.available()>0) {
                    		int rc = oldfont.get(fontName).readCode(in);
                    		sb.append(oldfont.get(fontName).toUnicode(rc));
                    	}
                    	//重置COSString对象
                    	sb.append("例");
                    	System.out.println("--Tj----"+sb.toString());
                    	previous.setValue(targetfont.encode(sb.toString()));
                    }
                }else if(next  instanceof COSArray) {
                    //PDF中的字符串 
                	byte[] pstring = {};
                    int prej = 0;
                    COSArray previous  =(COSArray)next;
                    //循环previous
                    for (int k = 0; k < previous.size(); k++) {
                        Object arrElement = previous.getObject( k );
                        if( arrElement instanceof COSString ){
                            //COSString对象>>创建java字符串的一个新的文本字符串。
                            COSString cosString =(COSString)arrElement;
                            //将此字符串的内容作为PDF文本字符串返回。 
                            if (j == prej) {
                            	byte[] thisbyte = cosString.getBytes();
                                byte[] temp = new byte[pstring.length+thisbyte.length];  
                                System.arraycopy(pstring, 0, temp, 0, pstring.length);
                                System.arraycopy(thisbyte, 0, temp, pstring.length, thisbyte.length);
                                pstring=temp;
                            } else {
                                prej = j;
                                pstring = cosString.getBytes();
                            }                       
                        }
                    }
                    try(InputStream in = new ByteArrayInputStream(pstring)){
                    	StringBuffer sb = new StringBuffer();
                    	while (in.available()>0) {
                    		int rc = oldfont.get(fontName).readCode(in);
                    		sb.append(oldfont.get(fontName).toUnicode(rc));
                    	}
                    	sb.append("例");
                    	System.out.println("TJ----"+sb.toString());
                    	COSString cosString2 = (COSString) previous.getObject(0);
                    	cosString2.setValue(targetfont.encode(sb.toString()));
                    }
                    int total = previous.size()-1;    
                    for (int k = total; k > 0; k--) {
                        previous.remove(k);
                    }
                }
            }
            PDStream updatedStream = new PDStream(pd);
            OutputStream out = updatedStream.createOutputStream();
            ContentStreamWriter tokenWriter = new ContentStreamWriter(out);
            tokenWriter.writeTokens(tokens);
            out.close();
            oldfont.forEach((k,v)->{
            	page.getResources().put(k, targetfont);
            });
            page.setContents(updatedStream);
		}
		pd.save("d:/1.pdf");
		pd.close();
	}
	

昨天的代码有问题,修改后
修改前
在这里插入图片描述
修改后
在这里插入图片描述

PDFBox 是一个开源的 Java 库,可以用来操作 PDF 文档。要替换 PDF 文档中的指定文本内容,可以使用 PDFBox文本定位工具和文本替换工具。 以下是一个简单的示例代码,演示如何使用 PDFBox 替换 PDF 文档中的指定文本内容: ```java import java.io.File; import java.io.IOException; import org.apache.pdfbox.pdmodel.PDDocument; import org.apache.pdfbox.pdmodel.PDPage; import org.apache.pdfbox.pdmodel.PDPageContentStream; import org.apache.pdfbox.pdmodel.font.PDType1Font; import org.apache.pdfbox.text.PDFTextStripper; import org.apache.pdfbox.text.TextPosition; public class PdfTextReplace { public static void main(String[] args) throws IOException { // 1. 打开 PDF 文档 File pdfFile = new File("example.pdf"); PDDocument document = PDDocument.load(pdfFile); // 2. 遍历每一页,查找并替换指定文本 for (PDPage page : document.getPages()) { PDPageContentStream contentStream = new PDPageContentStream(document, page, PDPageContentStream.AppendMode.APPEND, true); contentStream.beginText(); contentStream.setFont(PDType1Font.HELVETICA_BOLD, 12); PDFTextStripper stripper = new PDFTextStripper() { @Override protected void writeString(String text, List<TextPosition> textPositions) throws IOException { StringBuilder builder = new StringBuilder(); for (int i = 0; i < text.length(); i++) { char c = text.charAt(i); if (Character.isWhitespace(c)) { builder.append(c); } else { builder.append('*'); // 将非空白字符替换为 * } } contentStream.showText(builder.toString()); // 将替换后的文本写入到 PDF 中 } }; stripper.setSortByPosition(true); stripper.extractRegions(page); // 提取文本区域 contentStream.endText(); contentStream.close(); } // 3. 保存修改后的 PDF 文档 document.save("example_modified.pdf"); document.close(); } } ``` 上述代码中,首先打开指定的 PDF 文档,然后遍历每一页,使用 PDFTextStripper 提取文本区域,并将非空白字符替换为 *。最后将修改后的 PDF 文档保存到指定的文件中。你可以根据需要修改代码,以实现更复杂的文本替换功能。
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值