太方便了!利用Python对批量Pdf转Word

大家好,我是辰哥

在wps或者office里面可以将pdf转word,不过只能免费转前面5页,超过5页就需要会员。今天教大家一个Python办公小技巧:批量Pdf转Word ,这样可以自由想转多少页都可以。

思路:这里主要是利用了Python的pdfmine3k库去提取pdf文本内容,通过python-docx库去将内容保存到word中。

下面先看一下效果:

01

环境准备

在开始编写代码之前,咱们先安装一些用到的Python库,安装目录如下:

pip install pdfminer
pip install pdfminer3k
pip install python-docx

注意

使用 pip install docx 安装模块 docx 后,发现不能正常使用,

并报错 moduleNotFoundError:No module named 'exceptions'

正解

pip install python-docx

02

提取PDF内容

1.导入相应的库

from pdfminer.pdfparser import PDFParser, PDFDocument
from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter
from pdfminer.layout import LAParams
from pdfminer.converter import PDFPageAggregator
from pdfminer.pdfinterp import PDFTextExtractionNotAllowed

解释

2.读取pdf内容

在开始读取之前,先看一下pdf的内容:

辰哥这里以自己的原创文章按模块分类后,新建了一个两页的pdf文件。

上面代码是读取pdf文件,并把每一页内容放到doc.get_pages里面。

通过循环可以把每一页的内容提取出来,并把每一页内容打印输出

03

保存到word

上面我们已经成功将pdf的内容提取出来,接着我们将内容保存到word里面

在遍历pdf内容里面将内容逐步写入保存。最后保存命名为:Python研究者-辰哥.docx

04

小结

辰哥在本文中主要讲解了利用Python对批量Pdf转换为Word,不明白的地方可以在下方留言或者后台加辰哥微信,一起交流。

为了大家方便学习,辰哥已经把本文的完整源码上传,需要的在公众后台回复:pdf转换

最后说一声:原创不易,求给个赞、在看、评论

今日推荐

太赞了!Python竟可以轻松实现音频格式无损转换

再见Xshell、Xftp!Python执行Linux命令、上传下载远程文件

我去!爬虫遇到字体反爬,哭了

  • 1
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

lyc2016012170

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值