【Python服务生活系列--3】不氪金,不充会员,PDF转Word

文章介绍了如何利用Python的pdf2docx库进行批量PDF转Word操作,适用于文字型PDF。对于纯图PDF,推荐使用微信的OCR功能提取文字。操作简单,只需将代码和PDF放在同一目录运行即可。
摘要由CSDN通过智能技术生成

前言

不氪金,不开会员,搞定批量化pdf转word



正文开始

太过于简单,直接撸代码

import os
from pdf2docx import Converter
 
def pdf_docx():
    file_path = os.getcwd() # 获取当前工作目录 get current working dir 的简写
    for file in os.listdir(file_path):
        suff_name = os.path.splitext(file)[1]
        if suff_name != '.pdf':  # 
            continue
        file_name = os.path.splitext(file)[0]
        pdf_name = os.getcwd() + '\\' + file
        docx_name = os.getcwd() + '\\' + file_name + '.doc'  # 可以根据需要改成docx 或者是doc
        cv = Converter(pdf_name)
        cv.convert(docx_name)
        cv.close()

pdf_docx()

如何使用

新建一个目录,把代码和你需要转换的pdf放在一起,运行,完事。

注意事项

此方法适用于普通PDF文件,也就是文字型PDF。纯图pdf虽然也可以转换为word,但是打开word之后发现其实还是一个大图片。
因此纯图pdf目前暂时无法通过此方法转换
如果有copy纯图pdf文字内容的需求,可以考虑使用微信自带dOCR


关于微信自带OCR使用方法

发送带有文字的图片或者截图到微信文件传输助手,点开图片,你会发现图片上的文字上面的图片是可以直接勾选复制的

本期非常简单,希望老铁们学会~~
更多精品内容请关注公主号: HardcoreTech硬核科技

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值