1、第三方库下载:PyPDF2、PythonMagick、Ghostscript。
2、PythonMagick的官方下载链接为:http://www.imagemagick.org/download/python/,需要自己编译;一个好用的非官方链接为:http://www.lfd.uci.edu/~gohlke/pythonlibs/#pythonmagick。
3、如果报下面这种错误,多半是因为没装Ghostscript。
RuntimeError: python.exe: PostscriptDelegateFailed `D:\PdfToImage\pdftest.pdf':
No such file or directory @ error/pdf.c/ReadPDFImage/713
4、示例代码:
#encoding=utf-8
#author: walker
#date: 2014-05-15
#summary: 将pdf的每页转换为图片
import PythonMagick
from PyPDF2 import PdfFileReader
pdffile = "pdftest.pdf"
reader = PdfFileReader(file(pdffile, "rb"))
npage = reader.getNumPages()
for i in range(0, npage):
im = PythonMagick.Image(pdffile + '['+ str(i) +']')
im.write(pdffile[0:-4] + '_' + str(i)+ '.png')
2014-05-16追加:
发现一个非常好用pdf小工具:mupdf。共包含三个小工具:mupdf.exe,mudraw.exe,mutool.exe。将pdf转图片可以用这个命令:
mudraw -o out%d.png input.pdf
*** walker *** updated 2014-05-16 ***
转载于:https://blog.51cto.com/walkerqt/1411848