JAVA使用itextpdf文件,进行文件的创建流程、阅读加密、属性设置、中文显示处理、文档读取操作

程序猿最近要摘取pdf文件中的信息,选材用到了itextpdf工具包,整体比较简单,记录一下

1.pdf操作pom设置

<!-- https://mvnrepository.com/artifact/com.itextpdf/itextpdf -->
<dependency>
	<groupId>com.itextpdf</groupId>
	<artifactId>itextpdf</artifactId>
	<version>5.5.13</version>
</dependency>

<!-- https://mvnrepository.com/artifact/com.itextpdf/itext-asian -->
<!-- 处理中文字符 -->
<dependency>
	<groupId>com.itextpdf</groupId>
	<artifactId>itext-asian</artifactId>
	<version>5.2.0</version>
</dependency>

<!-- https://mvnrepository.com/artifact/org.bouncycastle/bcprov-jdk15 -->
<!-- 设置pdf查看密码使用 -->
<!-- <dependency> 这个没用
    <groupId>org.bouncycastle</groupId>
    <artifactId>bcprov-jdk15</artifactId>
    <version>1.46</version>
</dependency> -->

<!-- https://mvnrepository.com/artifact/org.bouncycastle/bcprov-jdk15on -->
<dependency>
    <groupId>org.bouncycastle</groupId>
    <artifactId>bcprov-jdk15on</artifactId>
    <version>1.62</version>
</dependency>
		

2.pdf文件的创建、属性标注

package com.chl.tools;

import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;

import org.slf4j.Logger;
import org.slf4j.LoggerFactory;

import com.itextpdf.text.BaseColor;
import com.itextpdf.text.Document;
import com.itextpdf.text.DocumentException;
import com.itextpdf.text.Font;
import com.itextpdf.text.PageSize;
import com.itextpdf.text.Paragraph;
import com.itextpdf.text.Rectangle;
import com.itextpdf.text.pdf.BaseFont;
import com.itextpdf.text.pdf.PdfReader;
import com.itextpdf.text.pdf.PdfWriter;
import com.itextpdf.text.pdf.parser.PdfTextExtractor;

public class PdfParse {
	
	private static Logger logger = LoggerFactory.getLogger(PdfParse.class);

	private static String pdfPath = "/Users/chenhailong/Desktop/hellopdf.pdf";
	
	public static void main(String[] args) {
		createPdf();
	}
	
	/**
	 * 创建pdf文件
	 * 1.创建Document文档
	 * - 设置doc的多种属性
	 * 2.PdfWriter初始化
	 * 3.打开文档
	 * 4.写入内容
	 * 5.关闭文档
	 * 
	 * 添加 itext-asian.jar 处理 中文问题
	 */
	private static void createPdf() {
		try {
			//设置pdf的纸张大小、背景色
			Rectangle rect = new Rectangle(PageSize.A4.rotate());  
			rect.setBackgroundColor(BaseColor.WHITE);
			
			//设置doc属性
			Document document = new Document(rect); 
			document.addAuthor("作者");
			document.addCreator("创作者");
			document.addCreationDate();
			document.addKeywords("pdf");
			document.addSubject("主题");
			document.addTitle("标题");
			document.setMargins(10, 20, 30, 40);
			
			PdfWriter pw = PdfWriter.getInstance(document, new FileOutputStream(pdfPath));
			
			document.open();  
			document.add(new Paragraph("Hello World wh")); 
			
			//设置新的一页
			document.newPage();  
			pw.setPageEmpty(false);  
			document.newPage();  
			document.add(new Paragraph("New page"));  
			
			document.close();  
		} catch (FileNotFoundException e) {
			e.printStackTrace();
		} catch (DocumentException e) {
			e.printStackTrace();
		} catch (IOException e) {
			e.printStackTrace();
		}  
	}
}

3.设置阅读密码

//设置阅读密码 
//userPassword the user password. Can be null or empty   
//ownerPassword the owner password. Can be null or empty
pw.setEncryption("123456".getBytes(), "123456".getBytes(),PdfWriter.ALLOW_SCREENREADERS,PdfWriter.STANDARD_ENCRYPTION_128);  

如果包引入的不对,可能会引发以下的异常

Exception in thread "main" java.lang.NoClassDefFoundError: org/bouncycastle/asn1/ASN1Primitive
	at com.itextpdf.text.pdf.PdfEncryption.<init>(PdfEncryption.java:147)
	at com.itextpdf.text.pdf.PdfWriter.setEncryption(PdfWriter.java:2132)
	at com.chl.tools.PdfParse.createPdf(PdfParse.java:59)
	at com.chl.tools.PdfParse.main(PdfParse.java:27)
Caused by: java.lang.ClassNotFoundException: org.bouncycastle.asn1.ASN1Primitive
	at java.net.URLClassLoader.findClass(URLClassLoader.java:381)
	at java.lang.ClassLoader.loadClass(ClassLoader.java:424)
	at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:349)
	at java.lang.ClassLoader.loadClass(ClassLoader.java:357)
	... 4 more

Exception in thread "main" java.lang.SecurityException: class "org.bouncycastle.asn1.ASN1Primitive"'s signer information does not match signer information of other classes in the same package
	at java.lang.ClassLoader.checkCerts(ClassLoader.java:898)
	at java.lang.ClassLoader.preDefineClass(ClassLoader.java:668)
	at java.lang.ClassLoader.defineClass(ClassLoader.java:761)
	at java.security.SecureClassLoader.defineClass(SecureClassLoader.java:142)
	at java.net.URLClassLoader.defineClass(URLClassLoader.java:467)
	at java.net.URLClassLoader.access$100(URLClassLoader.java:73)
	at java.net.URLClassLoader$1.run(URLClassLoader.java:368)
	at java.net.URLClassLoader$1.run(URLClassLoader.java:362)
	at java.security.AccessController.doPrivileged(Native Method)
	at java.net.URLClassLoader.findClass(URLClassLoader.java:361)
	at java.lang.ClassLoader.loadClass(ClassLoader.java:424)
	at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:349)
	at java.lang.ClassLoader.loadClass(ClassLoader.java:357)
	at com.itextpdf.text.pdf.PdfEncryption.<init>(PdfEncryption.java:147)
	at com.itextpdf.text.pdf.PdfWriter.setEncryption(PdfWriter.java:2132)
	at com.chl.tools.PdfParse.createPdf(PdfParse.java:59)
	at com.chl.tools.PdfParse.main(PdfParse.java:27)

4.设置pdf可以写入中文

//如有中文,需要设置font字体 , 依赖 itext-asian
BaseFont bfChinese = BaseFont.createFont( "STSongStd-Light" ,"UniGB-UCS2-H",BaseFont.NOT_EMBEDDED);
Font font = new Font(bfChinese);
document.add(new Paragraph("这是中文汉字",font)); 

5.读取pdf文件

//读取pdf文件的内容
private static void readPdf(String pdfPath) {
	try {
		pdfPath = "/Users/chenhailong/Desktop/中华人民共和国刑法修正案(九)全文.pdf";
		
		PdfReader pdf = new PdfReader(pdfPath);
		int i =pdf.getNumberOfPages();
		for(int count = 1;count<=i;count++) {
			System.out.println(PdfTextExtractor.getTextFromPage(pdf, count));
		}
	} catch (IOException e) {
		logger.info("read failed!{}",e);
		e.printStackTrace();
	}
}

针对pdf的写入操作,包含很多设置,请参考官网

https://www.baidu.com/link?url=9S5DyJU8NsnQtyu2JTZnS5WMUfGFfbfB8-O4vYZ4l0-63zr6hftU3Ud0IWZrq7YZ&wd=&eqid=e5085c7800041983000000065d35d240

操作pdf有 itextpdf, apache poi等工具,各个之间的对比参考

https://blog.csdn.net/u012397189/article/details/80196974

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: itextpdf是一个在Java环境下操作PDF文档的开源库。使用itextpdf可以实现创建、编辑、合并、拆分、转换PDF文档等功能,可广泛应用于企业文档的生成和管理、PDF报告的制作等场景。 itextpdf操作手册对itextpdf库的使用进行了详细介绍。手册主要分为三个部分,分别是前置知识准备、基础使用和高级使用。 前置知识准备部分介绍了需要掌握的Java基础知识、PDF文档的概念和结构、itextpdf的架构以及相关工具的使用。这一部分内容非常重要,对于初次使用itextpdf的开发者尤为重要,因为只有掌握了这些基础知识才能更好地理解后续内容。 基础使用部分介绍了itextpdf库的常用API和使用示例,包括创建PDF文档、添加页面、添加文本、添加图片、添加表格、添加注释等。这一部分内容非常详细,连手动创建PDF文档的每个步骤都有详细的说明和示例,使得用户可以快速上手使用itextpdf。 高级使用部分介绍了itextpdf库的高级特性,包括页面布局、字体处理、表格布局、加密、数字签名等。这是一个应用itextpdf进行开发的进阶部分,需要用户有一定的Java编程基础和itextpdf库的使用经验。 总之,itextpdf操作手册是itextpdf使用者必须掌握的一本工具书,对于想要在企业应用中使用itextpdf进行PDF文档处理的开发者尤为重要。 ### 回答2: iText是一个Java库,用于在PDF文档创建操作内容。它可以帮助我们轻松地生成PDF文档,插入文本、图片、表格、列表等内容,并可以进行页面布局和样式定义。 操作手册分为基础用法和高级用法两部分,基础用法介绍了如何在Java代码中创建一个简单的PDF文档,包括设置文档属性、插入文本和图片等。其中也介绍了如何设置字体、颜色和其他样式。 高级用法则介绍了如何更高效地操作PDF文档。举例来说,我们可以通过iText提供的API来合并、拆分和重排PDF文档,实现对文档内容的高效处理。在高级用法中,还会介绍如何设置表格、列表和书签等高级功能。 在学习iText时,我们需要了解Java中的文件IO操作,以及一些基本的PDF知识,如页面布局和PDF文档结构等。同时,我们可以参考iText官方文档和示例代码,以加深理解。 总的来说,iTextJava程序员提供了一个强大且易用的PDF处理工具。学习iText可以让我们轻松地生成高质量的PDF文档,并可以对文档进行高效的操作处理。 ### 回答3: itextpdf是一个Java库,用于创建操作PDF文档。它提供了一系列类和方法来生成、编辑、合并、拆分和加密PDF文档。它还支持添加文本、图形、图像、表格、列表、超链接和书签等元素,以及创建PDF表单、水印和数字签名。 为了使用itextpdf,你需要将其库文件添加到你的Java项目中。一旦你熟悉了它的基本概念和术语,你可以开始创建你的PDF文档。你可以使用iText API来控制PDF文档的几乎所有方面,包括页面大小、旋转和布局,字体、颜色和对齐方式,甚至是PDF的元数据、标签和结构。 当你在处理PDF文档时,一些常用的操作包括读取修改、添加和删除PDF页面、添加和删除PDF书签、加密和解密PDF文档等。除此之外,itextpdf还支持PDF表单的创建和填写、PDF的数字签名和时间戳签名,以及PDF文档的压缩和优化等广泛用途。 itextpdf的API文档和示例代码都可从其官方网站上获得。由于itextpdf的API非常强大和灵活,因此在开始使用前最好仔细阅读API文档,并参考官方示例以了解如何使用它的各个方面。另外,官方网站上还提供了一个免费的itextpdf教程,涵盖了从入门到高级用法的各种主题,非常有用。 总的来说,itextpdf是一个非常有用的PDF操作工具,可以让你轻松地创建、编辑和处理PDF文档。只要你花费一点时间学习它的API和使用技巧,就能够将其应用于各种应用场景中。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值