使用win10环境,简单安装一个库即可实现转换PDF成WORD。具体步骤如下:
一、使用快捷键“win+R”打开win10的cmd
二、安装pdf2docx库
pip install pdf2docx
安装界面如下:
三、切换到文件所在位置下,然后使用核心功能convert的命令行进行转换文档的所有页面。
cd /d C:/Users/Camila/Desktop ##打开文件所在文件夹
pdf2docx.exe convert test123.pdf test123.docx ##执行命令进行转换,pdf为需要转换的文件; .docx为转换后生成的文件,自定义文件名均可
转换完成界面如下:
四、可以设置转换的开始与中止页
1)设置开始页:从第2页开始转换,直至结束
pdf2docx.exe convert test123.pdf test1231.docx --start=2
转换完成界面如下:
2)设置中止页:从开始转换到第2页结束
pdf2docx.exe convert test123.pdf test1232.docx --end=2
转换完成界面如下:
3)设置开始和中止页:从第2页开始转换,到第3页结束
pdf2docx.exe convert test123.pdf test1233.docx --start=2 --end=3
转换完成界面如下:
更方便的图形界面来啦!!!
五、GUI
在cmd输入:
pdf2docx gui
会出现如下界面,选则需要转换的pdf文件和转换后的文件位置,点击蓝色的“convert”即可完成。
经验证,转换后的word格式不保证,但是文字提取能力还是不错的,可以用来一些无法复制文字的pdf文件,用于提取文件,便于使用。特此记录!