pdfbox java_Java PDFBox 教程

本文详细介绍了如何使用Apache PDFBox Java库来创建、读取、写入和处理PDF文件,包括添加文本、图像、元数据等操作,提供了一系列示例代码。
摘要由CSDN通过智能技术生成

Java PDFBox 教程展示了如何使用 PDFBox 在 Java 中创建 PDF 文件。

PDFBox

Apache PDFBox 是一个开源 Java 库,可用于创建,渲染,打印,拆分,合并,更改,验证和提取 PDF 文件的文本和元数据。

另一个非常流行的用于处理 PDF 文件的 Java 库称为 iText 。

PDFBox Maven 依赖项

我们需要为我们的项目添加以下 Maven 依赖项。

Java PDFBox 写文本

在下面的示例中,我们创建一个 PDF 文档并将一些文本写入其中。

JavaPdfBoxWriteText.java

该示例将四行内容写入 PDF 文档。

创建一个新的PDDocument。 默认情况下,文档具有 A4 格式。

创建一个新页面并将其添加到文档中。

要写入 PDF 页面,我们必须创建一个PDPageContentStream对象。

在beginText()和endText()方法之间写入文本。

我们设置字体和文本开头。

我们使用newLineAtOffset()方法开始新的一行文本。 页面的原点位于左下角。

文本使用showText()方法编写。

使用newLine()方法,我们移至下一行文本的开头。

Java PDFBox 读取文本

下一个示例从 PDF 文件读取文本。

JavaPdfBoxReadText.java

该示例打印 PDF 文档的文本及其大小。

我们从src/main/resources目录加载 PDF 文档。

PDFTextStripper用于从 PDF 文件提取文本。

Java PDFBox 创建图像

下一个示例在 PDF 文档中创建图像。

JavaPdfBoxCreateImage.java

该示例从目录加载图像,创建新的 PDF 文档,然后将图像添加到页面中。

PDImageXObject用于处理 PDFBox 中的图像。

我们得到图像的宽度和高度。

PDPageContentStream's drawImage()将图像绘制到页面中。

Java PDFBox 文档信息

PDF 文档可以包含描述文档本身或文档中某些对象(例如文档的作者或创建日期)的信息。 可以使用PDDocumentInformation对象设置和检索基本信息。

JavaPdfBoxDocumentInformation.java

该示例创建一些文档信息元数据。 该信息可以在 PDF 查看器中的 PDF 文档属性中看到。

我们得到PDDocumentInformation对象。

我们设置一些元数据信息。

Java PDFBox 编写元数据

可扩展元数据平台(XMP)是用于创建,处理和交换数字文档和数据集的标准化和自定义元数据的 ISO 标准。 PDF 文件使用 XMP 来存储其他元数据信息。

metadata.xml

这是一个 XML 文档,其中包含有关 PDF 文档的一些基本元数据。

JavaPdfBoxMetadataWrite.java

该示例从 XML 文件读取元数据,并将其存储在生成的二进制文档中。

PDMetadata用于处理元数据。

我们将元数据设置为文档的目录。

Java PDFBox 读取元数据

在下一个示例中,我们从 PDF 文档中读取元数据。

JavaPdfBoxMetadataRead.java

该示例从 PDF 文档读取元数据,并将其打印到控制台。

我们从PDDocumentCatalog中检索PDMetadata。

该文档可能不包含元数据; 因此,我们进行一些简单的检查。

createInputStream()为文档的元数据创建输入流。 我们从该流中读取数据并将其打印到终端。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值