效果图
PDF文件
转成后的word文件
工具与技术
GUI图形技术: PySimpleGUI 具体描述可看上一篇文章 Python-写个gif图片生成器(斗图小神器)
pdf2docx 库
这是一个在github 上存在的第三方库,可以帮助我们很好将 pdf转成word文件,常规的一般都可以直接转换,复杂的可能会有些格式问题,如果是扫描件可能不太好使。 总的来说足够解决一般日常生活中用到的场景了
安装
pip install pdf2docx
程序代码
画一个符合自己预期的图形化界面
def create_layout():
# 设置主题
sg.change_look_and_feel("GreenMono")
# 设置内容
layout = [
[sg.InputText(key="in_file"), sg.FileBrowse('选择PDF文件', button_color=sg.GREENS[0])],
[sg.InputText(key="out_file"), sg.FolderBrowse('选择输入目录')],
[sg.Button("开始生成", button_color=(sg.YELLOWS[0], sg.BLUES[0])), sg.Button("关闭")],
[sg.Output(size=(80, 20))]
]
return layout
简单校验下界面输入的 输入输出目录
# 校验参数
def check_file(in_file, out_file):
if in_file.endswith(".pdf")and out_file:
return True
if not out_file:
print("请选择输出目录!!!")
return False
print("文件不符合格式,请重新选择!!!")
return False
PDF转Word方法
def pdf2doc(pdf_name, out_file):
# 转化pdf文件
cv = Converter(pdf_name)
try:
# file_name 要转换成word的文件名 start: 开始页 end 结束页 默认是0开始到最后一页
cv.convert(str(out_file)+"/result.docx", start=0, end=None)
except Exception as e:
print("转化出错:", e)
return False
cv.close()
return True
整体代码如下
import PySimpleGUI as sg
from pdf2docx import Converter
def create_layout():
# 设置主题
sg.change_look_and_feel("GreenMono")
# 设置内容
layout = [
[sg.InputText(key="in_file"), sg.FileBrowse('选择PDF文件', button_color=sg.GREENS[0])],
[sg.InputText(key="out_file"), sg.FolderBrowse('选择输入目录')],
[sg.Button("开始生成", button_color=(sg.YELLOWS[0], sg.BLUES[0])), sg.Button("关闭")],
[sg.Output(size=(80, 20))]
]
return layout
# 校验参数
def check_file(in_file, out_file):
if in_file.endswith(".pdf")and out_file:
return True
if not out_file:
print("请选择输出目录!!!")
return False
print("文件不符合格式,请重新选择!!!")
return False
def pdf2doc(pdf_name, out_file):
# 转化pdf文件
cv = Converter(pdf_name)
try:
# file_name 要转换成word的文件名 start: 开始页 end 结束页 默认是0开始到最后一页
cv.convert(str(out_file)+"/result.docx", start=0, end=None)
except Exception as e:
print("转化出错:", e)
return False
cv.close()
return True
if __name__ == '__main__':
layout = create_layout()
window = sg.Window("欢迎使用pdf转word神器1.0.0版本!!!", layout)
while True:
event, values = window.read()
if event in [None, "关闭", "exit"]:
break
if event == "开始生成":
in_file = values["in_file"]
out_file = values["out_file"]
is_success = check_file(in_file, out_file)
if is_success:
pdf2doc(in_file, out_file)
print("word文件生成成功!!!!")
print("生成目录为:",str(out_file)+"/result.docx")
window.close()
程序代码可直接复制运行,运行后即可出现以上效果图 !!!
程序猿与投资生活实录已改名为 程序猿知秋,WX 公众号同款,欢迎关注!