python3 PDF转TXT文本，全角转半角

最新推荐文章于 2022-08-08 10:59:38 发布

SUKI547

最新推荐文章于 2022-08-08 10:59:38 发布

阅读量484

点赞数

分类专栏： Python

本文链接：https://blog.csdn.net/SUKI547/article/details/102903376

版权

偷懒，想把PDF的参考文献爬下来转文本。
首先安装依赖
pip install pdfminer3k

# -*- coding:utf-8
import sys
import importlib
importlib.reload(sys)
from pdfminer.pdfparser import PDFParser,PDFDocument
from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter
from pdfminer.converter import PDFPageAggregator
from pdfminer.layout import LTTextBoxHorizontal,LAParams,LTTextBox,LTTextLine
from pdfminer.pdfinterp import PDFTextExtractionNotAllowed

'''
 解析pdf 文本，保存到txt文件中
'''
path =r'/Users/.pdf'
def parse(

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

SUKI547

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python3 PDF转TXT文本，全角转半角

偷懒，想把PDF的参考文献爬下来转文本。首先安装依赖pip install pdfminer3k# -*- coding:utf-8import sysimport importlibimportlib.reload(sys)from pdfminer.pdfparser import PDFParser,PDFDocumentfrom pdfminer.pdfinterp imp...
复制链接

扫一扫