本文将介绍通过Java程序来读取PDF文档中的文本和图片的方法。分别调用方法extractText()和extractImages()来读取。
使用工具:Free Spire.PDF for Java(免费版)
Jar文件获取导入:
方法1:通过官网下载jar包。
Free Spire.PDF for JAVA | 下载www.e-iceblue.cn![95c8e86b4c626845fa66d4824aeda026.png](https://i-blog.csdnimg.cn/blog_migrate/3039da97d5609a1c2f41ee7006ccffba.png)
下载后,解压文件,并将lib文件夹下的Spire.Pdf.jar文件导入java程序。
方法2: 可通过maven仓库安装导入,可参考导入方法:
通过 Maven 仓库安装 Spire 系列 Java 产品www.e-iceblue.cn![9535d5209054d35cb68b3e181b8ff83f.png](https://i-blog.csdnimg.cn/blog_migrate/d86681f552141e58d11363ed1d89f474.png)
Java代码示例
【示例1】读取PDF中的文本
import
文本读取结果:
![ab126a00fbe7050f097b282de437f2b7.png](https://i-blog.csdnimg.cn/blog_migrate/98cc4c8a591c6d0fa3741694df112322.jpeg)
【示例2】读取PDF中的图片
import
图片读取结果:
![8b1054fd3d15b6601179dda49b26cc65.png](https://i-blog.csdnimg.cn/blog_migrate/a5dbb94aad309d1c74630d3b23d3f90c.jpeg)
(本文完)