java 读取加密得PDF文件
今天接到一个读取pdf得产品需要要做调研,然后百度查了资料发现很少有这方面得,还是记录下可以使用得一个方式。
使用 itextpdf类库
maven 配置:
<dependency>
<groupId>com.itextpdf</groupId>
<artifactId>itextpdf</artifactId>
<version>5.5.10</version>
</dependency>
<dependency>
<groupId>com.itextpdf</groupId>
<artifactId>itext-asian</artifactId>
<version>5.2.0</version>
</dependency>
<dependency>
<groupId>org.bouncycastle</groupId>
<artifactId>bcprov-jdk15on</artifactId>
<version>1.47</version>
</dependency>
<dependency>
<groupId>org.bouncycastle</groupId>
<artifactId>bcmail-jdk15on</artifactId>
<version>1.47</version>
</dependency>
</dependencies>
案例demo:
public static void readPdf(byte[] fileBytes){
String pageContent = "";
String pwd ="12345";//密码
try {
PdfReader reader = new PdfReader(fileBytes,pwd .getBytes());//解析pdf
int pageNum = reader.getNumberOfPages();
for(int i=1;i<=pageNum;i++){
pageContent += PdfTextExtractor.getTextFromPage(reader, i);//读取第i页的文档内容
}
System.out.println(pageContent);
} catch (Exception e) {
e.printStackTrace();
}finally{
}
}