近期有一些工作上的事情需要对pdf进行一些的操作,所以结下来稍微总结一下吧:
写在前面:
需要对PyPDF2,PyMuPDF库安装
直接pip就好:
pip install PyPDF2
pip install PyMuPDF
Pdf操作相关代码实现:
1.使用PyMuPDF从PDF中提取图像
import fitz
pdf_document = fitz.open("C题copy.pdf")
for current_page in range(len(pdf_document)):
for image in pdf_document.getPageImageList(current_page):
xref = image[0]
pix = fitz.Pixmap(pdf_document,xref)
if pix.n < 5:
pix.writePNG("page%s-%s.png" % (current_page , xref)
)
else:
pix1 = fitz.Pixmap(fitz.csRGB , pix)
pix1.writePNG("page%s-%s.png" %(current_page , xref))
pix1 =