前言
不氪金,不开会员,搞定批量化pdf转word
正文开始
太过于简单,直接撸代码
import os
from pdf2docx import Converter
def pdf_docx():
file_path = os.getcwd() # 获取当前工作目录 get current working dir 的简写
for file in os.listdir(file_path):
suff_name = os.path.splitext(file)[1]
if suff_name != '.pdf': #
continue
file_name = os.path.splitext(file)[0]
pdf_name = os.getcwd() + '\\' + file
docx_name = os.getcwd() + '\\' + file_name + '.doc' # 可以根据需要改成docx 或者是doc
cv = Converter(pdf_name)
cv.convert(docx_name)
cv.close()
pdf_docx()
如何使用
新建一个目录,把代码和你需要转换的pdf放在一起,运行,完事。
注意事项
此方法适用于普通PDF文件,也就是文字型PDF。纯图pdf虽然也可以转换为word,但是打开word之后发现其实还是一个大图片。
因此纯图pdf目前暂时无法通过此方法转换
如果有copy纯图pdf文字内容的需求,可以考虑使用微信自带dOCR
关于微信自带OCR使用方法
发送带有文字的图片或者截图到微信文件传输助手,点开图片,你会发现图片上的文字上面的图片是可以直接勾选复制的
本期非常简单,希望老铁们学会~~
更多精品内容请关注公主号: HardcoreTech硬核科技