大家伙,我是小白小帅,不知道小伙伴们是否有过这样的苦恼,就是无法对pdf文件进行编辑,第三方软件要么就是收费要么就得开通会员,就算找到在线的免费转换工具,还得登录扫码注册啥的,很是烦躁,所以我基于python中的pdf2docx模块为小伙伴们封装了一个功能,拿去就能将pdf转换成word文档啦,废话不多说,直接上完整代码
# -*- coding: utf-8 -*-
import logging
import os
from pdf2docx import Converter
class PDFtoDOCXConverter:
def __init__(self, input_path, output_path):
self.input_path = input_path
self.output_path = output_path
def convert(self):
try:
if not os.path.exists(self.input_path):
logging.error(f"找不到指定的PDF文件:{self.input_path}")
return
cv = Converter(self.input_path)
cv.convert(self.output_path, start=0, end=None)
cv.close()
logging.info(f"成功将PDF文件 '{self.input_path}' 转换为Word文档 '{self.output_path}'")
except Exception as e: