【Python】使用pdf2docx库将.pdf转化为.docx

本文介绍了如何在VScode中搭建Python环境,然后通过pip安装pdf2docx库来实现PDF到DOCX的转换。提供了三种方法,包括使用parse和convert函数,以及通过命令行接口进行转换。并提到了转化效果。
摘要由CSDN通过智能技术生成

1、使用VS code搭建Python编译环境

2、安装pdf2doc库1

pip install pdf2docx

在这里插入图片描述

3、编写代码

3.1 使用parse将pdf转化为docx

编写 pdf2docxParse.py

from pdf2docx import parse
# 文件名
pdf_file = 'demo-image-overlap.pdf'
docx_file = 'demo-image-overlap.docx'

# 将pdf转为docx
parse(pdf_file, docx_file)

运行 pdf2docxParse.py

python pdf2docxParse.py 

在这里插入图片描述

3.2 使用convert将pdf转化为docx

3.2.1 编写 pdf2docxConvert.py

from pdf2docx import Converter
# 文件名
pdf_file = 'demo-image-overlap.pdf'
docx_file = 'demo-image-overlap.docx'
cv = Converter(pdf_file)
cv.convert(docx_file, start=0, end=None)
cv.close()

3.2.2 运行 pdf2docxConvert.py

python pdf2docxConvert.py

在这里插入图片描述

3.3 使用命令行输入pdf 转化pdf

3.3.1 编写 SMQHPdf2Docx.py

'''
  @Description 使用命令行到处pdf
  @Author: 少莫千华
  @Time:  2023-06-11
'''
# import logging
import argparse
from pdf2docx import Converter

def main(pdf_file,docx_file):
    cv = Converter(pdf_file)
    cv.convert(docx_file, start=0, end=None)
    cv.close()
    
if __name__ == "__main__":
    parser = argparse.ArgumentParser()
    parser.add_argument("--pdf",type=str)
    args = parser.parse_args()
    # logging.debug(args.pdf)
    main(args.pdf,args.pdf + '.docx')

3.2.3 运行 SMQHPdf2Docx.py

python SMQHPdf2Docx.py --pdf demo-image-overlap.pdf

在这里插入图片描述

3.3 转化效果

PDF

在这里插入图片描述

DOCX

在这里插入图片描述


  1. 点击查看pdf2doc详细说明 ↩︎

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值