图片转PDF,PDF转Word
首先,我们需要去下载python库,PyMupdf以及pdf2docx
可以直接使用pip去安装
在安装的过程中可能会出现报错,一般是因为存在不兼容的包,此时可以新创建一个虚拟环境去运行。话不多说,直接上代码
import fitz.fitz
import os
# 将pdf转换为图片
def pdf_to_image(pdfPath, imagePath):
pdfDoc = fitz.open(pdfPath)
for pg in range(pdfDoc.pageCount):
page = pdfDoc[pg]
pix = page.getPixmap(alpha=False) # 默认是720*x尺寸
if not os.path.exists(imagePath):
os.makedirs(imagePath)
pix.writePNG(imagePath + '/' + 'images_%s.jpg' % pg) # 将图片写入指定的文件夹内
# 将pdf转换为txt文字
def pdf_to_text(pdfPath):
doc = fitz.open(pdfPath)
for page in doc:
text = page.getText()
print(text)
#将图片转为pdf
def img_to_pdf(imgPath):
doc = fitz.open()
for path in imgPath:
img = fitz.open(path)#打开图片
pdfbytes = img.convertToPDF() # 使用图片创建单页的 PDF
imgpdf = fitz.open("pdf", pdfbytes)
doc.insertPDF(imgpdf)
doc.save('D:\桌面\\实验.pdf')
if __name__ == '__main__':
imgPaths = []
imgPath = "D:\桌面\\图片\\{}.png"
for i in range(1,5):
imgPaths.append(imgPath.format(i))
img_to_pdf(imgPaths)
上面图片转pdf是直接将所有的图片转换到一个pdf里面,可以根据自己的需要去转换。