php tar 提取,PdfParser一个独立的PHP库,提供从PDF文件中提取数据的各种工具

PdfParser

Pdf Parser, a standalone PHP library, provides various tools to extract data from a PDF file.

68747470733a2f2f7472617669732d63692e6f72672f736d616c6f742f7064667061727365722e7376673f6272616e63683d6d617374657268747470733a2f2f7363727574696e697a65722d63692e636f6d2f672f736d616c6f742f7064667061727365722f6261646765732f7175616c6974792d73636f72652e706e673f623d6d617374657268747470733a2f2f7363727574696e697a65722d63692e636f6d2f672f736d616c6f742f7064667061727365722f6261646765732f636f7665726167652e706e673f623d6d617374657268747470733a2f2f706f7365722e707567782e6f72672f736d616c6f742f7064667061727365722f6c6963656e7365

68747470733a2f2f706f7365722e707567782e6f72672f736d616c6f742f7064667061727365722f7668747470733a2f2f706f7365722e707567782e6f72672f736d616c6f742f7064667061727365722f646f776e6c6f61647368747470733a2f2f706f7365722e707567782e6f72672f736d616c6f742f7064667061727365722f642f6d6f6e74686c7968747470733a2f2f706f7365722e707567782e6f72672f736d616c6f742f7064667061727365722f642f6461696c79

Test the API on our demo page.

This project is supported by Actualys.

Features

Features included :

Load/parse objects and headers

Extract meta data (author, description, ...)

Extract text from ordered pages

Support of compressed pdf

Support of MAC OS Roman charset encoding

Handling of hexa and octal encoding in text sections

PSR-0 compliant (autoloader)

PSR-1 compliant (code styling)

Currently, secured documents are not supported.

This Library is still under active development. As a result, users must expect BC breaks when using the master version.

Documentation

Original PDF References files can be downloaded from this url: http://www.adobe.com/devnet/pdf/pdf_reference_archive.html

License

This library is under the LGPLv3 license.

PdfParser一个 PHP ,可以用于读取 PDF 文件的内容。它可以将 PDF 文件解析成一个包含文本、字体、颜色等信息的对象结构。在使用 PdfParser 之前,需要先安装 Composer,然后使用 Composer 安装 PdfParser。 安装 Composer Composer 是 PHP一个依赖管理工具,可以用于安装和管理 PHP 。在安装 PdfParser 之前,需要先安装 Composer。可以在 Composer 的官网上下载最新的安装包,也可以使用命令行进行安装。这里介绍使用命令行进行安装的方法。 在终端输入以下命令: ``` php -r "copy('https://getcomposer.org/installer', 'composer-setup.php');" php composer-setup.php php -r "unlink('composer-setup.php');" ``` 这些命令将会从 Composer 的官网上下载安装脚本,然后运行该脚本进行安装。安装完成后,可以在命令行输入 `composer` 命令来验证是否安装成功。 安装 PdfParser 安装完成 Composer 后,可以使用 Composer 来安装 PdfParser。在终端执行以下命令: ``` composer require andrewsville/php-pdf-parser ``` 这些命令将会从 Packagist 上下载并安装 PdfParser 。 读取 PDF 文件 安装完成 PdfParser 后,就可以使用它来读取 PDF 文件了。以下是一个简单的示例,演示了如何读取 PDF 文件的内容: ```php <?php require_once 'vendor/autoload.php'; use Smalot\PdfParser\Parser; $parser = new Parser(); $pdf = $parser->parseFile('example.pdf'); $text = $pdf->getText(); echo $text; ``` 在上面的代码,首先使用 `Parser` 类创建一个解析器对象,然后使用 `parseFile` 方法将 PDF 文件解析成一个对象。最后,使用 `getText` 方法获取 PDF 文件的文本内容,并将其输出到屏幕上。 需要注意的是,PdfParser 只能读取 PDF 文件的文本内容。如果 PDF 文件包含图片或其他非文本内容,PdfParser 将无法读取这些内容。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值