pdf转word应是一个很常见的需求,网上有些免费的转换工具,一方面不安全,有文件泄露风险,另一方面有免费转换的次数限制。我们可以使用python的pdf2docx模块来实现这个功能。
首先,当然是安装这个模块,过程中会安装一些依赖:
$ pip install pdf2docx
然后,把需要转换的文件地址和目标路径设置好作为参数传给convert方法就可以啦。
from pdf2docx import Converter
pdf_file = 'C:\\Users\\wuchenwei\\Desktop\\xlt\\xlt.pdf'
docx_file = 'C:\\Users\\wuchenwei\\Desktop\\xlt\\xlt.docx'
cv = Converter(pdf_file)
cv.convert(docx_file, start=0, end=None)
cv.close()
效果如下:
打开之后也没有问题,真的香!