一、介绍 Apache PDFbox是一个开源的、基于Java的、支持PDF文档生成的工具库,它可以用于创建新的PDF文档,修改现有的PDF文档,还可以从PDF文档中提取所需的内容。Apache PDFBox还包含了数个命令行工具。 Apache PDFbox于前不久发布了最新的1.8.2版。 二、特征 Apache PDFBox主要有以下特征: 1)文本提取:从PDF文档中提取文本。