pdf文件转word文件——Python工具之pdf2docx库的安装+使用+问题解决

最新推荐文章于 2025-03-01 16:05:23 发布

syluxhch

最新推荐文章于 2025-03-01 16:05:23 发布

阅读量2.9k

点赞数 2

分类专栏：实用小工具文章标签： pdf word

本文链接：https://blog.csdn.net/syluxhch/article/details/134809931

版权

实用小工具专栏收录该内容

2 篇文章

订阅专栏

#创作灵感#

偶尔在网上看到一篇文章《太牛了！只需2行代码，轻松将PDF转换成Word!》，知道了pdf2docx这个库，于是试了一下实现效果，感觉还行，记录下来。上面文章写的有些杂乱错误，仅供参考。

安装第三方库的时候，记得注意，如果新建了虚拟环境，需要将库安装到你的虚拟环境下，否则会导致import导入报错，因为你的虚拟环境中没有你安装的库，你把库安装到默认环境中（例如Anaconda的base环境中），在新建的虚拟环境中，是无法使用的，除非解释器使用默认的解释器。

环境配置：我使用的是Anaconda安装的Python3.10，Pycharm作为编辑器，并使用Pycharm在Anaconda中新建了虚拟环境，如下图。

安装pdf2docx库：在上图中点击Anaconda图标，使用Conda软件包管理器进行安装，点击+号，在弹出的对话框中输入pdf2docx进行搜索，安装。

遇到报错：注意文件名不要和库名重复，否则会报错。例如我最开始把文件命名为pdf2docx.py，结果一直报错，ImportError: cannot import name 'Converter' from partially initialized module 'pdf2docx' (most likely due to a circular import) 。

修改错误：将文件名改为pdf2word，错误消失，并成功将pdf文的转换为docx文件。

实现代码：代码中start=0是pdf转换的起始页，end=123是结束页，如果不填这两项就是默认从第一页至最后一页。

from pdf2docx import Converter

pdf_file = 'D:\pythonProject\pythonExploring\P020231128362131003708.pdf'
docx_file = 'D:\pythonProject\pythonExploring\P020231128362131003708.docx'
conv = Converter(pdf_file)
conv.convert(docx_file, start=0, end=123)
conv.close()

转换效果：对比了原pdf文件和转换后生成的docx文件内容，准确率很高。

pdf界面