参考资料:
基本概述:
- PDFlib是功能强大的PDF处理SDK,且围绕PDF的处理有众多的产品
PDFlib | PDFlib 是领先的开发人员工具箱,用于生成和操作 Adobe 众所周知的可移植文档格式 (PDF) 的文件。 |
PDFlib+PDI | PDFlib+PDI 包括所有 PDFlib 函数以及 PDF 导入库 (PDI)。使用 PDI,您可以打开现有的 PDF 文档并将某些页面合并到 PDFlib 输出中。 |
PDFlib Personalization Server (PPS) | PDFlib Personalization Server (PPS) 包括 PDFlib+PDI 以及使用 PDFlib 块进行可变数据处理的附加功能。PPS 使应用程序独立于任何布局更改。 |
PDFlib TET | PDFlib 文本和图像提取工具包 (TET) 是一种开发人员产品,用于从 PDF 文档中可靠地提取文本、图像和元数据。 |
PDFlib TET PDF IFilter | TET PDF IFilter 从 PDF 文档中提取文本和元数据,并使其可用于 Windows 上的搜索和检索软件。这允许在本地桌面、公司服务器或 Web 上搜索 PDF 文档。 |
PDFlib PLOP | PDFlib PLOP(PDF 线性化、优化、保护)提供了一种简单的方法来线性化和优化您的 PDF 文件以实现快速 Web 交付,以及应用或删除 Acrobat 安全功能。 |
PDFlib PLOP DS | PDFlib PLOP DS(数字签名)提供 PLOP 的所有功能,以及将数字签名应用于 PDF 文档的能力。 |
pCOS Interface | pCOS 界面提供了一个简单而优雅的工具,用于从 PDF 文档中检索不属于页面内容的任何信息。它是PDFlib+PDI、PPS、TET、TET PDF IFilter和PLOP / PLOP DS产品的集成部分。 |
- 其中,元数据指的是中介数据,包括数据以及数据的属性信息,PDFlib具体表现为xml等结构性文件
- 本文我们仅针对PDF向结构化信息文件XML文件的转化,如果需要其他功能可以参考本文的开发过程
PDFlib TET使用简介:
- 官方文档的介绍此处就不再赘述了,主要讲解一下个人在使用过程中的心得;
- 首先,该插件分为免费试用版和收费版,免费试用版对PDF有两个要求:大小不能超过1M且页数不能超过10页