PDF转化为TXT简单工具(适合程序员使用)

支持python3版本的pdfminer,请参见
https://pypi.python.org/pypi/pdfminer3k/

1、下载pdfminer

http://www.unixuser.org/~euske/python/pdfminer/
然后解压缩

[root@node1 ~]# unzip pdfminer-master.zip   
[root@node1 ~]# cd pdfminer-master

2、安装pdfminer

(1)python2.x
pdfminer提示需要python2.x环境
Install Python 2.4 or newer. (Python 3 is not supported.)

[root@node1 ~]# python --version
Python 2.6.6
[root@node1 ~]#

(2)安装pdfminer

[root@node1  pdfminer-master]# ls
cmaprsrc  docs  LICENSE  Makefile  MANIFEST.in  pdfminer  README.md  samples  setup.py  tools
[root@node1  pdfminer-master]# python setup.py install
/usr/lib64/python2.6/distutils/dist.py:266: UserWarning: Unknown distribution option: 'install_requires'
  warnings.warn(msg)
running install
running build
running build_py
creating build

running install_scripts
copying build/scripts-2.6/pdf2txt.py -> /usr/bin
copying build/scripts-2.6/dumppdf.py -> /usr/bin
copying build/scripts-2.6/latin2ascii.py -> /usr/bin
changing mode of /usr/bin/pdf2txt.py to 755
changing mode of /usr/bin/dumppdf.py to 755
changing mode of /usr/bin/latin2ascii.py to 755
running install_egg_info
Writing /usr/lib/python2.6/site-packages/pdfminer-20140328-py2.6.egg-info
[root@node1  pdfminer-master]# 

3、pdf转化txt测试

[root@node1  ~]# pdf2txt.py a.pdf > a.txt
[root@node1  ~]# cat a.txt
工 作 简 报  
第 2 期(总第 2 期) 
送:各普通会员单位 
[root@node1  ~]# 
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值