Qt for Python(七):pdf转文本

本文介绍了如何在Python环境下,利用pdfminer3k库将PDF文件转换成文本。首先,详细说明了安装稳定版pdfminer3k的步骤,避免使用最新版可能遇到的问题。然后,展示了一个测试程序,该程序打开PDF文件,解析其内容,并将其保存到TXT文件中。最后,作者提供了联系方式以供进一步交流。
摘要由CSDN通过智能技术生成

环境:win7_64  py3

第一步:安装pdf操作库 pdfminer3k

pdfminer3k是python3使用的pdfminer的版本,

这里安装一定要选定稳定版版本号,

pip自动选择的最新版,貌似有问题,坑了我好久

具体用法官网看文档

https://pypi.org/project/pdfminer3k/1.0.1/

pip3 install pdfminer3k =1.2.4

第二步:测试程序

# encoding: utf-8

 

import sys

import importlib

importlib.reload(sys)

 

from pdfminer.pdfparser import PDFParser,PDFDocument

from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter

from pdfminer.converter import PDFPageAggregator

from pdfminer.layout import LTTextBoxHorizontal,LAParams

from pdfminer.pdfinterp import PDFTextExtractionNotAllowed


 

'''

解析pdf 文本,保存到txt文件中

'''

path ="example.pdf"

def p

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值