表格常见于 PDF 发票和财务报告中。您可能会遇到需要将 PDF 表格数据导出到 Excel 中的情况,以便您可以使用 MS Excel 提供的工具对数据进行分析。本文介绍了如何使用 Spire.Office for Java 类库从 PDF 页面中提取表格并将其导出为单独的 Excel 工作表。
本篇的代码是为了实现如上图的功能,从PDF中识别并导出Excel。
安装 Spire.Office for Java
该场景实际上是使用 Spire.PDF for Java 从 PDF 中提取表格,并使用 Spire.XLS for Java 生成 Excel 文件。为了在同一个项目中使用它们,您需要将 Spire.Office.jar 文件添加为 Java 程序中的依赖项。
可以从此链接下载 JAR 文件。如果您使用 Maven,您可以通过将以下代码添加到项目的 pom.xml 文件中轻松地在应用程序中导入 JAR 文件。
<repositories>
<repository>
<id>