#代码生活# 读取PDF文字并存储到word文件中

该博客介绍了一个使用Python进行办公自动化的方法,具体是通过`pdfplumber`库读取PDF文件并利用`docx`库将提取的文字保存到Word文档中。示例代码展示了如何遍历PDF的每一页,提取文本并添加到新的Word文件中。
摘要由CSDN通过智能技术生成

Python办公自动化:PDF文字提取到word文件中

  • 需求解读
  • 需要用到的扩展库
  • 代码实现
# 把pdf中的文字提取到word文件中
import pdfplumber
import docx
# 利用扩展库打开pdf 文件,并存储pdf内存对象
with pdfplumber.open ('D://XX业务/XXX/XXX市场/2020销年1月XXX销年报告总结.pdf') as pdf:
    #新建一个文档对象
    dc=docx.Document()
    #循环遍历每一页的pdf
    for page in pdf.pages:
        #把每一页的pdf中的文本作为一个段落添加到文档中
        dc.add_paragraph(page.extract_text())
    dc.save('./2020.1报告.docx')
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值