pdfToText安装
我这里是进入docker php后执行(sudo docker exec -it php bash)
安装sudo apt-get install poppler-utils
然后执行 pdftotext -enc UTF-8 book1.pdf book1.txt
成功即可。
PHP调用示例如下:
<?php
function pdf()
{
$pdfFile = '/var/www/html/public/office/p1.pdf';
$txtFile = '/var/www/html/public/office/p1.txt';
$cmd = "pdftotext -enc UTF-8 {$pdfFile} {$txtFile} 2>&1";
$result = shell_exec($cmd);//运行命令
$text = file_get_contents($txtFile);
echo $text;
}
pdf();
exit;
但我在访问http时laravel报错了,原因是权限未设置,将目录sudo chmod -R 777 public/ storage/
下面步骤可以省略
2 下载安装包:https://dl.xpdfreader.com/xpdf-tools-linux-4.04.tar.gz
(http://www.xpdfreader.com/download.html)
然后解压 tar -xf filename.tar 得到bin64目录。
然后进入bin64目录解压执行:
pdftotext -enc UTF-8 book1.pdf book1.txt
成功