Python-听说比付费的还好使哦(PDF转Word 文件)

效果图

PDF文件

转成后的word文件

工具与技术

GUI图形技术: PySimpleGUI   具体描述可看上一篇文章  Python-写个gif图片生成器(斗图小神器)

pdf2docx 库

这是一个在github 上存在的第三方库,可以帮助我们很好将 pdf转成word文件,常规的一般都可以直接转换,复杂的可能会有些格式问题,如果是扫描件可能不太好使。 总的来说足够解决一般日常生活中用到的场景了

安装

pip install pdf2docx

程序代码

画一个符合自己预期的图形化界面

def create_layout():
    # 设置主题
    sg.change_look_and_feel("GreenMono")

    # 设置内容
    layout = [
        [sg.InputText(key="in_file"), sg.FileBrowse('选择PDF文件', button_color=sg.GREENS[0])],
        [sg.InputText(key="out_file"), sg.FolderBrowse('选择输入目录')],
        [sg.Button("开始生成", button_color=(sg.YELLOWS[0], sg.BLUES[0])), sg.Button("关闭")],
        [sg.Output(size=(80, 20))]
    ]
    return layout

简单校验下界面输入的 输入输出目录

# 校验参数
def check_file(in_file, out_file):
    if in_file.endswith(".pdf")and out_file:
        return True

    if not out_file:
        print("请选择输出目录!!!")
        return False

    print("文件不符合格式,请重新选择!!!")
    return False

PDF转Word方法

def pdf2doc(pdf_name, out_file):
    # 转化pdf文件
    cv = Converter(pdf_name)
    try:
        #  file_name 要转换成word的文件名   start: 开始页    end 结束页    默认是0开始到最后一页
        cv.convert(str(out_file)+"/result.docx", start=0, end=None)
    except Exception as e:
        print("转化出错:", e)
        return False
    cv.close()
    return True

整体代码如下

import PySimpleGUI as sg
from pdf2docx import Converter


def create_layout():
    # 设置主题
    sg.change_look_and_feel("GreenMono")

    # 设置内容
    layout = [
        [sg.InputText(key="in_file"), sg.FileBrowse('选择PDF文件', button_color=sg.GREENS[0])],
        [sg.InputText(key="out_file"), sg.FolderBrowse('选择输入目录')],
        [sg.Button("开始生成", button_color=(sg.YELLOWS[0], sg.BLUES[0])), sg.Button("关闭")],
        [sg.Output(size=(80, 20))]
    ]
    return layout


# 校验参数
def check_file(in_file, out_file):
    if in_file.endswith(".pdf")and out_file:
        return True

    if not out_file:
        print("请选择输出目录!!!")
        return False

    print("文件不符合格式,请重新选择!!!")
    return False


def pdf2doc(pdf_name, out_file):
    # 转化pdf文件
    cv = Converter(pdf_name)
    try:
        #  file_name 要转换成word的文件名   start: 开始页    end 结束页    默认是0开始到最后一页
        cv.convert(str(out_file)+"/result.docx", start=0, end=None)
    except Exception as e:
        print("转化出错:", e)
        return False
    cv.close()
    return True


if __name__ == '__main__':
    layout = create_layout()
    window = sg.Window("欢迎使用pdf转word神器1.0.0版本!!!", layout)
    while True:
        event, values = window.read()
        if event in [None, "关闭", "exit"]:
            break

        if event == "开始生成":
            in_file = values["in_file"]
            out_file = values["out_file"]
            is_success = check_file(in_file, out_file)
            if is_success:
                pdf2doc(in_file, out_file)
                print("word文件生成成功!!!!")
                print("生成目录为:",str(out_file)+"/result.docx")
    window.close()

程序代码可直接复制运行,运行后即可出现以上效果图 !!!

程序猿与投资生活实录已改名为  程序猿知秋,WX 公众号同款,欢迎关注!

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值