1、电脑上安装Python运行环境
一、python官网下载链接
二、下载到电脑后,直接运行安装
三、安装完成后按:win+R键进入window命令控制窗口,输入
python --version
2、设置python依赖包国内镜像源
pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/
3.以下代码选用一种,在电脑上的某一个目录下新建python代码文件,并在window窗口中安装对应依赖
第一种:pdf2doc_pdf2docx.py(推荐)
pip install pdf2docx
from pdf2docx import Converter
# 最轻量,效果不错,推荐!!
# 安装依赖命令:pip install pdf2docx
# 转换函数
def pdf_to_word(pdf_file_path, word_file_path):
# 创建一个 PDF 转换器
cv = Converter(pdf_file_path)
# 转换 PDF 文件为 Word 文档
cv.convert(word_file_path, start=0, end=None)
# 关闭转换器
cv.close()
# 转换完成,docx_file 是生成的word文档
print(f'pdf转docx成功 {pdf_file_path} to {word_file_path}')
if __name__ == '__main__':
# 指定 PDF 文件路径
pdf_file = 'C:\\Users\\kaka\\Desktop\\pdf\\高级Java开发工程师.pdf'
# 输出 Word 文件路径
docx_file = 'C:\\Users\\kaka\\Desktop\\Desktop\\pdf\\高级Java开发工程师.docx'
# 调用函数进行转换
pdf_to_word(pdf_file, docx_file)
运行示例:
第一步
第二步
python C:\Users\kaka\PycharmProjects\flaskProject\test\pdf2doc_pdf2docx.py
第三步,回车运行就可以了
第二种:pdf2doc_office.py
import office
# 依赖包较大,但功能比较全;官网:https://www.python-office.com/
# 安装依赖命令:pip install python-office
if __name__ == '__main__':
# 指定 PDF 文件路径
pdf_file = 'C:\\Users\\kaka\\Desktop\\pdf\\高级Java开发工程师.pdf'
# 输出 Word 文件路径,不用写文件名
docx_file = 'C:\\Users\\kaka\\Desktop\\pdf'
office.pdf.pdf2docx(file_path=pdf_file, output_path=docx_file)
print("PDF 转换成功")
第三种:pdf2doc_office.py
from spire.pdf import PdfDocument
from spire.pdf import FileFormat
# 最轻量,效果不错,推荐!!
# 安装依赖命令:pip install Spire.PDF
def pdf_to_word(pdf_path, path_doc, path_docx):
# 创建一个 PDF 文档对象
document = PdfDocument()
# 加载 PDF 文件
document.LoadFromFile(pdf_path)
# 将PDF文件直接转换为Doc文件并保存
document.SaveToFile(path_doc, FileFormat.DOC)
# 将PDF文件直接转换为Docx文件并保存
document.SaveToFile(path_docx, FileFormat.DOCX)
# 关闭 PDF 文档
document.Close()
print("PDF 转换成功")
if __name__ == '__main__':
# 指定 PDF 文件路径和输出 Word 文件路径
pdf_file = 'C:\\Users\\kaka\\Desktop\\pdf\\高级Java开发工程师.pdf'
word_file_doc = 'C:\\Users\\kaka\\Desktop\\pdf\\PDF转DOC.doc'
word_file_docx = 'C:\\Users\\kaka\\Desktop\\pdf\\PDF转DOCX.docx'
# 调用函数进行转换
pdf_to_word(pdf_file, word_file_doc, word_file_docx)