如何使用Python 操作PDF?总结用Python操作PDF的几种方法

本篇文章小编给大家分享一个用python来操作pdf图像的几种方法,如果有需求的小伙伴一定要耐心阅读完这篇文章,小编希望能够通过这篇文章来给大家的学习带来一定的帮助。

Python操作PDF有以下几种方法:

(1)基本操作

PyPDF2 导入模块的代码常常是:

from PyPDF2 import PdfFileReader, PdfFileWriter

这里导入了两个方法:

PdfFileReader 可以理解为读取器

PdfFileWriter 可以理解为写入器

接下来通过几个案例进一步认识这两个工具的奇妙之处,用到的示例文件是5个发票的 pdf

每个发票的 PDF 都由两页组成:

(2)合并

第一个工作是将5个发票pdf合并成10页。这里读取器和写入器应该怎么配合呢?

逻辑如下:

读取器将所有pdf读取一遍

读取器将读取的内容交给写入器

写入器统一输出到一个新pdf

这里还有一个重要的知识点:读取器只能将读取的内容一页一页交给写入器。

因此,逻辑中第1步和第2步实际上不是彼此独立的步骤,而是读取器读取完一个pdf后,就将这个pdf全部页循环一遍,挨页交给写入器。**后等读取工作全部结束后再输出。

看一下代码可以让思路更清楚:

from PyPDF2 import PdfFileReader, PdfFileWriter
path = r'C:Usersxxxxxx'
pdf_writer = PdfFileWriter()
for i in range(1, 6):
    pdf_reader = PdfFileReader(path + '/INV{}.pdf'.format(i))
    for page in range(pdf_reader.getNumPages()):
        pdf_writer.addPage(pdf_reader.getPage(page))
with open(path + r'合并PDFmerge.pdf', 'wb') as out:
    pdf_writer.write(out)

由于全部内容都需要交给同一个写入器最后一起输出,所以写入器的初始化一定是在循环体之外的.

如果在循环体内则会变成每次访问读取一个pdf就生成一个新的写入器,这样每一个读取器交给写入器的内容就会被反复覆盖,无法实现我们的合并需求!

循环体开头的代码:

for i in range(1, 6):
    pdf_reader = PdfFileReader(path + '/INV{}.pdf'.format(i))

目的就是每次循环读取一个新的pdf文件交给读取器进行后续操作。实际上这种写法不是很提倡,由于各 pdf 命名恰好很规则,所以可以直接人为指定数字进行循环。更好的方法是用 glob 模块:

import glob
for file in glob.glob(path + '/*.pdf'):
    pdf_reader = PdfFileReader(path)

代码中 pdf_reader.getNumPages(): 能够获取读取器的页数,配合 range 就能遍历读取器的所有页。

pdf_writer.addPage(pdf_reader.getPage(page)) 能够将当前页交给写入器。

最后,用 with 新建一个 pdf 并由写入器的 pdf_writer.write(out) 方法输出即可。

(3)拆分

如果明白了合并操作中读取器和写入器的配合,那么拆分就很好理解了,这里我们以拆分 INV1.pdf 为2个单独的 pdf 文档为例,同样也先来捋一捋逻辑:

读取器读取 PDF 文档

读取器一页一页交给写入器

写入器每获取一页就立即输出

通过这个代码逻辑我们也可以明白,写入器初始化和输出的位置一定都在读取 PDF 循环每一页的循环体内,而不是在循环体外

代码很简单:

from PyPDF2 import PdfFileReader, PdfFileWriter
path = r'C:Usersxxx'
pdf_reader = PdfFileReader(path + 'INV1.pdf')
for page in range(pdf_reader.getNumPages()):
    # 遍历到每一页挨个生成写入器
    pdf_writer = PdfFileWriter()
    pdf_writer.addPage(pdf_reader.getPage(page))
    # 写入器被添加一页后立即输出产生pdf
    with open(path + 'INV1-{}.pdf'.format(page + 1), 'wb') as out:
        pdf_writer.write(out)

(4)水印

本次的工作是将下图作为水印添加到 INV1.pdf 中

首先是准备工作,将需要作为水印的图片插入 word 中调整合适位置后保存为PDF文件。然后就可以码代码了,需要额外用到 copy 模块。

就是把读取器和写入器初始化,并且把水印 PDF 页先读取好备用,核心代码稍微比较难理解:

加水印本质上就是把水印 PDF 页和需要加水印的每一页都合并一遍

由于需要加水印的 PDF 可能有很多页,而水印 PDF 只有一页,因此如果直接把水印 PDF 拿来合并,可以抽象理解成加完第一页,水印 PDF 页就没有了。

以上就是小编给大家带来的Python操作PDF的几种方法,希望大家通过阅读小编的文章之后能够有所收获!如果大家觉得小编的文章不错的话,可以多多分享给有需要的人。

如果你也喜欢编程,想通过学习Python获取更高薪资,这里给大家分享一份Python学习资料。

😝朋友们如果有需要的话,可以点击下方链接免费领取或者V扫描下方二维码免费领取🆓

👉CSDN大礼包🎁:全网最全《Python学习资料》免费分享(安全链接,放心点击)👈

1️⃣零基础入门

① 学习路线

对于从来没有接触过Python的同学,我们帮你准备了详细的学习成长路线图。可以说是最科学最系统的学习路线,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
在这里插入图片描述

② 路线对应学习视频

还有很多适合0基础入门的学习视频,有了这些视频,轻轻松松上手Python~
在这里插入图片描述

③练习题

每节视频课后,都有对应的练习题哦,可以检验学习成果哈哈!
在这里插入图片描述

2️⃣国内外Python书籍、文档

① 文档和书籍资料

在这里插入图片描述

3️⃣Python工具包+项目源码合集

①Python工具包

学习Python常用的开发软件都在这里了!每个都有详细的安装教程,保证你可以安装成功哦!
在这里插入图片描述

②Python实战案例

光学理论是没用的,要学会跟着一起敲代码,动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。100+实战案例源码等你来拿!
在这里插入图片描述

③Python小游戏源码

如果觉得上面的实战案例有点枯燥,可以试试自己用Python编写小游戏,让你的学习过程中增添一点趣味!
在这里插入图片描述

4️⃣Python面试题

我们学会了Python之后,有了技能就可以出去找工作啦!下面这些面试题是都来自阿里、腾讯、字节等一线互联网大厂,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。
在这里插入图片描述
在这里插入图片描述

5️⃣Python兼职渠道

而且学会Python以后,还可以在各大兼职平台接单赚钱,各种兼职渠道+兼职注意事项+如何和客户沟通,我都整理成文档了。
在这里插入图片描述

上述所有资料 ⚡️ ,朋友们如果有需要的,可以扫描下方👇👇👇二维码免费领取🆓

  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python OpenGL PDF 是指使用 Python 编程语言结合 OpenGL 图形库来处理 PDF 文件的相关操作Python 是一种高级编程语言,具有简单易学、动态类型等特点,广泛用于数据分析、科学计算以及图形处理等领域。 OpenGL 是一种跨平台的图形处理库,提供了丰富的图形渲染和三维绘制等功能,可以帮助开发者实现复杂的图形效果。 PDF(Portable Document Format)是一种用于表示电子文件的格式,它可以保留文档的格式和布局,同时支持跨平台的可视化和打印。 Python OpenGL PDF 的应用主要包括以下几个方面: 1. 创建 PDF 文件:开发者可以使用 PythonPDF 库(例如 ReportLab)结合 OpenGL 绘制的结果生成 PDF 文件,实现自定义的可视化报告和文档。 2. 解析和提取 PDF 文件内容:通过使用 Pythonpdfminer 库等,可以解析 PDF 文件,并提取其中的文本、图像等元素,进而进行相关数据分析和图像处理。 3. PDF 文件的渲染和编辑:结合 Python 的 OpenGL 图形库,开发者可以对 PDF 文件进行二维或三维的渲染和编辑,比如添加图形、修改颜色和纹理等。 4. PDF 文件的导出和打印:通过 Python 的 OpenGL 图形库,可以将处理后的图形效果导出为 PDF 文件,进而实现打印输出或与其他应用程序进行交互。 综上所述,Python OpenGL PDF 可以帮助开发者处理 PDF 文件的创建、解析、渲染、编辑和打印等操作,为其带来更多的应用和创新空间。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值