一、背景描述
1、问题:使用pdf2image进行PDF内容切分为图片时报错:pdf2image.exceptions.PDFInfoNotInstalledError: Unable to get page count
2、系统环境:win 11
3、工具包:pdf2image
二、解决方案
1、原因
缺少了Poppler工具的依赖,Poppler是一个用于处理PDF文件的开源工具库。在使用 pdf2image 库之前,需要安装Poppler,并将其添加到系统的PATH环境变量中。
2、处理步骤
2.1安装Poppler
(1)访问:https://github.com/oschwartz10612/poppler-windows/releases/tag/v23.11.0-0
(2)点击Release-23.11.0-0.zip进行下载
(3)解压该文件
2.2环境变量配置
(1)进入到bin文件夹进行路径复制
(2)打开控制面板 -> 系统-> 系统 -> 高级系统设置 -> 环境变量
(3)将Poppler添加到系统的PATH环境变量,在变量值中添加Poppler的路径,例如:C:\xxx\poppler-23.11.0\Library\bin,确保路径正确。
(4)关闭VSCode,并重新运行,可看到正确输出图片