python实现PDF压缩

本文介绍了一个基于PYMUPDF实现的PDF图片压缩工具,通过提取原PDF中的图片并压缩,最终合并为新的PDF文件,显著减少了文件大小。压缩过程分为图片提取、压缩及PDF合并三个步骤,并提供了完整的代码示例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目前只针对纯PDF图片压缩

实现原理: 主要通过PYMUPDF进行图片提取,图片压缩,再合并生成一个新的PDF。

最后用Pyqt封装成EXE

1. 提取原PDF关键代码

pdffile = "t2.pdf"
doc = fitz.open(pdffile)
width, height = fitz.PaperSize("a4")

totaling = doc.pageCount

for pg in range(totaling):
    page = doc[pg]
    zoom = int(100)
    rotate = int(0)
    print(page)
    trans = fitz.Matrix(zoom / 100.0, zoom / 100.0).preRotate(rotate)
    pm = page.getPixmap(matrix=trans, alpha=False)

    lurl='pdf/%s.jpg' % str(pg+1)
    pm.writePNG(lurl)
doc.close()

2.合并图片生成PDF

#coding:utf-8
import glob
import fitz
import os

def pictopdf():
    doc = fitz.open()
    for img in sorted(glob.glob("pdf/*")):  # 读取图片,确保按文件名排序
        print(img)
        imgdoc = fitz.open(img)                 # 打开图片
        pdfbytes = imgdoc.convertToPDF()        # 使用图片创建单页的 PDF
        imgpdf = fitz.open("pdf", pdfbytes)
        doc.insertPDF(imgpdf)                   # 将当前页插入文档
    if os.path.exists("newpdf.pdf"):        # 若文件存在先删除
        os.remove("newpdf.pdf")
    doc.save("newpdf.pdf")                   # 保存pdf文件
    doc.close()

3、效果图如下:

原PDF大小:44.2M,压缩后:7.2M

4,pyqt实现的PDF压缩工具下载:

https://download.csdn.net/download/jylonger/10553922

评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值