开始的环境是 win10+python3环境。
试过用库imagemagick,其实没用上,因为imagemagick库我根本就没有装上。
之后又用到wand的库,编译成功了,但是运行时总是报错,无法识别pdf;
查找原因Wand是一个基于ctypes的简单ImageMagick绑定Python。它目前没有涵盖MagickWand API的所有功能。
最后用到了 pdf2image,但是在windows上运行会报错在debug时找到问题在Popen找不到路径,查找Popen的资料并没有显示不能再windows上运行。抱着试一试的态度在linux虚拟机上试了一下,竟然一下就成功了。
以下是代码:
from pdf2image import convert_from_path
import tempfile
def main(filename, outputDir):
print('filename=', filename)
print('outputDir=', outputDir)
with tempfile.TemporaryDirectory() as path:
images = convert_from_path(filename)
for index, img in enumerate(images):
img.save('%s/page_%s.png' % (outputDir, index))
if __name__ == "__main__":
main('/home/pdfimage/2.pdf', '/home/pdfimage/b')
代码很简单,pdf2image的库很强大,哈哈。
之后会找到一种可以代替Popen的方法在windows上跑通,再继续补充。。。。。