手把手 | 20行Python代码教你批量将PDF转为Word

在日常工作或学习中,经常会遇到这样的无奈:

“小任,你把这个PDF中的文件码出来发我”

艹,倒霉,2M的PDF12点也完不了啊!

80793d3a7d51abae3ad586fc1d85b2faed8a4a1a

很多时候在学习时发现许多文档都是PDF格式,PDF格式却不利于学习使用,因此需要将PDF转换为Word文件,但或许你从网上下载了很多软件,但只能转换前五页(如WPS等),要不就是需要收费,那有没有免费的转换软件呢?

so,我们给各位带来了一个免费简单快速的方法,手把手教你用Python批量处理PDF格式文件,获取自己想要的内容,存为word形式。

在实现PDF转Word功能之前,我们需要一个python的编写和运行环境,同时安装好相关的依赖包。 对于python环境,我们推荐使用PyCharm。 在本地电脑环境,anaconda提供了非常便利的安装和部署。

PDF转Word功能所需的依赖包如下:

  • PDFParser(文档分析器)
  • PDFDocument(文档对象)
  • PDFResourceManager(资源管理器)
  • PDFPageInterpreter(解释器)
  • PDFPageAggregator(聚合器)
  • LAParams(参数分析器)
前期准备工作

说明:本文是在Windows7下使用python最新的3.6版本

1.安装pdfminer3k模块

安装anaconda后,直接可以通过pip安装

原文链接

  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值