如何将PDF文档中的图片提取出来?

如何将PDF文档中的图片提取出来?
PDF是我们经常接触的一种文档,但对于它的一些编辑操作却并不熟悉,比如有时需要将文档中的图片提取出来,应该如何处理呢?
一、普通文档
常见的PDF文档一般由Word另存为或PDF软件编辑,这种由文字和图片组成的普通文档操作会比较简单。
方法1:复制图片
首先用极速PDF阅读器打开文档,然后在图片处单击鼠标右键并选择“复制图片”,这时就可以粘贴发送了。
当然如果需要将图片保存下来,可以多操作一步,在任意聊天工具窗口或Word文档中,选中图片后单击鼠标右键选择“另存为图片”即可。
在这里插入图片描述

方法2:保存图片
打开PDF文档后,点击工具栏顶端的“编辑”跳转到编辑页面;或者直接用极速PDF编辑器打开文档均可。
接着点击工具栏的“对象工具”,单击选中图片,然后在图片处单击鼠标右键选择“图像”中的“提取到文件”
最后在弹出的“输入已提取图片的文件名”窗口中,输入图片名称后,点击“确定”即可成功保存到桌面。
在这里插入图片描述
二、扫描版PDF
这类PDF文件本身整个文档就是图片,操作起来就比较复杂,所以我们可以采用截图的方式实现。
还是继续用极速PDF阅读器打卡文档,然后点击工具栏的“截图”工具。
接着在需要保存的图片处按住鼠标左键拉取截图范围,这时弹出一个工具选项,点击“下载”按钮即可将图片保存,点击“√”复制图片,点击“×”关闭当前截图操作。(注意选择“√”仅仅只是复制图片,并没有进行保存操作,务必点击下载键后再选择存储文件夹进行保存)
在这里插入图片描述

`PyMuPDF`(也称为`fitz`)是一个Python库,用于处理PDF、XPS、EPUB和其他格式的文档。通过`PyMuPDF`可以实现提取PDF文件的电子签章等功能。以下是使用`PyMuPDF`提取电子签章的基本步骤: 1. 首先确保已经安装了`PyMuPDF`库,如果没有安装,可以使用pip安装命令:`pip install pymupdf`。 2. 导入`fitz`模块。 3. 使用`fitz.open()`函数打开目标PDF文件。 4. 遍历PDF的所有页面,使用`get annots`方法获取每一页上的注释列表。 5. 对于获取到的注释列表,检查它们是否为签名注释。在`PyMuPDF`,电子签章是作为特定类型的注释存在的,通常是`/Annot`类型的`/Widget`字典,并且具有`/Subtype`键值`/Sig`。 6. 提取电子签章相关的属性,如签章图像、签章时间、签章者信息等。 下面是一个简单的代码示例: ```python import fitz # 导入fitz模块 def extract_signatures(pdf_path): pdf = fitz.open(pdf_path) # 打开PDF文件 signatures = [] # 初始化一个空列表来存储找到的签章信息 for page in pdf: # 遍历每一页 annots = page.get annots() # 获取当前页的所有注释 for annot in annots: # 遍历注释 if annot["Subtype"] == "Widget" and "/Sig" in annot: # 检查注释是否为电子签章 signature = { "page": page.number, # 获取当前页码 "rect": annot.rect, # 获取签章的位置和大小 # 可以继续提取其他签章信息 } signatures.append(signature) # 将签章信息添加到列表 return signatures # 返回所有找到的签章信息 # 使用函数提取签章信息 pdf_path = "example.pdf" # 替换为你的PDF文件路径 signatures = extract_signatures(pdf_path) for sig in signatures: print(sig) ``` 请确保将`example.pdf`替换为你要提取签章的PDF文件路径。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值