今天有个活儿需要把PDF转PPTX,可能因PDF文件太大,很多软件都转换失败了。抱着试试的想法从网上找了一个python写的PDF转PPTX项目,果然不负期待,转换成功!但使用过程中发现需要poppler库,这个过程中遇个坑,好在给填平了。总结一下跟大家分享。
1、PDF转PPTX下载地址:
原文链接:https://zhuanlan.zhihu.com/p/139704240
这里作者介绍了用法和对部分功能的修改,例如去除时间。
2、【重点来了】项目需要poppler库,Windows如何安装poppler库?
亲测成功版:
原文链接:https://blog.csdn.net/sinat_37967865/article/details/102477235
Windows的poppler下载地址:http://blog.alivate.com.au/poppler-windows/
a、点击红框内容下载,若有新的可以使用新版本:
b、库解压后内容如图:
c、解压后可将该内容放到python库管理文件中(具体看个人喜好),方便后期管理。另外重点,poppler网站中提到需要配置一下PATH环境。
poppler库在电脑中的位置:(路径内容根据存放位置而定,我的安装了anaconda所以有虚拟器名,未安请忽略。主要内容【poppler-0.68.0\bin】)
C:\Users\用户名.conda\envs\虚拟器名\Tools\poppler-0.68.0\bin
PATH环境配置
此电脑右键属性,点击【高级系统属性】,【环境变量】,双击【系统变量】中的【Path】选项,在【编辑环境变量】选择新建,粘贴poppler库的bin路径。如图
至此,poppler库就添加完了。【重启电脑,重启电脑,重启电脑,重要的事情说三遍】
如不重启转换中可能遇到如下报错:
pdf2image.exceptions.PDFInfoNotInstalledError: Unable to get page count. Is poppler installed and in PATH?
该工程还需要【pptx】【pdf2image】【pdf2pptx】这3个库,按pip正常安装即可。