CentOS 下 PDF to TEXT 指令
CentOS 下 PDF to TEXT 指令
从 http://www.xpdfreader.com/download.html 下载 :
Download the Xpdf command line tools:
Linux 32/64-bit: download (GPG signature)
然后解压 tar -xf filename.tar 得到bin64目录。
然后执行:
pdftotext -enc UTF-8 book1.pdf book1.txt
导出中文txt