python 区域截图_Python截图PDF，在指定区域并提取文本

最新推荐文章于 2024-10-10 17:57:35 发布

今日温度适宜

最新推荐文章于 2024-10-10 17:57:35 发布

阅读量1.8k

点赞数 2

文章标签： python 区域截图

本文链接：https://blog.csdn.net/weixin_31324995/article/details/113494916

版权

本文介绍了如何使用PyMuPDF库来解决存在旋转文字的PDF的区域截图和文本提取问题。首先尝试了pdfplumber库，但发现其在文字提取方面效果不佳。然后详细展示了PyMuPDF的使用，包括设置截图区域、旋转和保存截图，以及正确提取和排序PDF中的文本。

摘要由CSDN通过智能技术生成

作者：小小明,「快学Pthon」专栏作者

先说需求：PDF文件结构都一致，对于下图红框区域截图并提取文本

测试pdfplumber库

先试用一下pdfplumber看看能否提取出文本

import pdfplumber

with pdfplumber.open("测试文档.pdf") as p:

page = p.pages[0]

print(page.extract_text())

运行结果：

Date of Test : 2020-11-05 R

Test Engineer : ? e

KAYSER-THREDE Contact Name : WX u

00 EVAluation Version: 2.1.7 sample.def ta

1 n

Y, 6

g] 40 1

n [ . P

ati20 ag

e e

cel o

ac0 f J

071H 7

-20 .0; Vo = 15 / 2020-11HEAD00ead Acce 822-75

0-40 3.889 m1-0500E2ACleration -HFC

1080 /s; M = 11 RA / CFC SP 1 Res A_202

g]60 60 kg 1000ultant 0_11_

t [ 0

n 5

ulta40 13

e _

r0 2

2 5

0 F

-200 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200 rid

time [ms] y

, 6

Analysis Interval: 0 - 1000 [ms] naly.202

Max(61 ms) = 72 g; Min(4.3 ms) = 0.04043 g s0

cHoICn t=. A330m7 (s5(55.64. 6-1 6 -6 .539 m.61s )m; Hs)IC =3 665 =.7 340 g7; ( c5u5.m4 .- A 636m.3s m =s 7);0 H.1I8C g15 = 307

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

今日温度适宜

关注关注

2
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Python实现Excel根据指定区域截图（Windows版本）

杨鑫newlife的专栏

05-22

8070

# -*- coding:utf-8 -*- __author__ = 'yangxin_ryan' from win32com.client import Dispatch, DispatchEx import pythoncom from PIL import ImageGrab """ 对excel的表格区域进行截图——用例： excel_catch_screen...

python制作指定区域截图工具_Python截图PDF，在指定区域并提取文本

weixin_39983912的博客

03-02

523

作者：小小明,「快学Pthon」专栏作者先说需求：PDF文件结构都一致，对于下图红框区域截图并提取文本测试pdfplumber库先试用一下pdfplumber看看能否提取出文本importpdfplumberwithpdfplumber.open("测试文档.pdf")asp:page=p.pages[0]print(page.extract_text())运行结果：DateofT...

参与评论您还未登录，请先登录后发表或查看评论

python从文档中提取指定部分,如何使用Python从PDF的特定区域提取文本？

weixin_27743991的博客

11-26

1253

I'm trying to extract Text from a PDF using Python, and I have successfully done so using PyPDF2 like this:import PyPDF2pdfFileObj = open('path', 'rb')pdfReader = PyPDF2.PdfFileReader(pdfFileObj)pageO...

python对指定文件夹的所有pdf进行截图并且保存到目标文件夹（一）

ChenWenKen的博客

03-01

2543

功能解析：使用python对指定文件夹的所有pdf进行截图并且保存到目标文件夹。步骤：一，遍历存储目标文件夹的存储pdf的文件夹；二，在指定的路径创建原先存储pdf的文件夹，名称相同；三，遍历存储pdf的文件，截图并存储到目标文件夹。 import os import datetime import fitz NOW_DAY = datetime.date.today().strftime('%m-%d') #存储pdf的文件 FEILE_ADDR = r'路径' #输出目标文件夹 TARGET_ADDR

python获取屏幕截图区域坐标

最新发布

m0_69482013的博客

10-10

1683

这个代码会提示你逐步移动鼠标确定截图区域的左上角和右下角坐标，然后计算出截图区域的宽度和高度，并返回这个区域的参数。可以根据这个区域参数进行后续的数字识别和比较操作。上述答题助手中许多朋友不知道该如何获取屏幕截图区域信息，我写了一个比较简单的思路，大家可供参考。

python中怎么截图_用python实现截屏识别其中的文字

weixin_34487308的博客

01-29

2066

原标题：用python实现截屏识别其中的文字大家好，欢迎来到 Crossin的编程教室！你一定用过那种“OCR神器”，可以把图片中的文字提取出来，极大的提高工作效率。下次，当你想要复制“百度文库”中的内容时，不妨试试这个程序。效果预览源码解析1)等待用户截图此处需要借助贴图神器( Snipaste)其中“f1”是截图的快捷键，“ctrl+c”是把截图保存到剪贴板的快捷键。如果使用qq截图的...

python截屏保存到指定文件夹_自动保存邮件附件至指定文件夹

weixin_31755877的博客

01-09

243

最近有个需求，ERP系统会自动发很多csv附件到我邮箱，我需要把这些附件上传到FTP服务器，服务器会把这些csv的数据写到另外一个系统的数据库。每次大概有30个邮件，每个邮件有一个附件，而且附件的名字都一样，是一个csv的文件，我每次需要手动的把附件另存为一个新名字存到本地，然后FTP上传。每次大概要浪费我10分钟时间，而且毫无价值。于是我就写了一个VBA的自动处理程序，几秒搞定。如果你也有类似的...

Python+Selenium中对指定元素截图

pengjunlee的博客

06-20

2万+

# -*- coding: utf-8 -*- from PIL import Image from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriv...

对pdf指定区域截图并提取文字

热门推荐

小小明-代码实体的专栏

12-30

4万+

作者：小小明明镜本清净，明镜亦非台。本来无一物，何处惹尘埃！截图PDF指定区域并提取文件需求：PDF文件结构都一致，对于下图红框区域截图并提取文本测试pdfplumber库先试用一下pdfplumber看看能否提取出文本 import pdfplumber with pdfplumber.open("测试文档.pdf") as p: page = p.pages[0] print(page.extract_text()) 运行结果： Date of Test : 202.

Python提取pdf文件目录_Demo源码

07-10

这个Demo的执行流程大致是这样的：通过命令行指定PDF文件路径和输出格式（JSON或文本），然后运行`bookmark.py`脚本，它会读取PDF，提取书签，将其转换为JSON格式，并根据用户选择的输出方式写入文件。 Python的...

python项目源码_实例50_Python一键提取PDF中的表格到Excel.rar

04-11

在本项目"Python一键提取PDF中的表格到Excel"中，我们关注的是如何使用Python编程语言高效地从PDF文档中抽取表格数据，并将其转换为可编辑的Excel格式。这个过程涉及到了多个关键知识点，包括PDF解析、表格识别以及...

translate_PDF翻译_PDF翻译、python_pdfTranslate_

10-01

在这个文件中，我们可以预期找到读取PDF，提取文本，调用翻译服务，以及创建和写入Word文档的相关代码。开发者可能使用了像PyPDF2或PDFMiner这样的库来处理PDF，用requests库与翻译API交互，然后可能使用docx库将...

pythonPDF_pdf_python_

09-29

标题"pythonPDF_pdf_python_"暗示我们将讨论使用Python进行PDF操作，主要涉及PDF文档的拆分。描述中的关键点在于"通过python语言编程实现多页PDF文档拆分，拆分为单个PDF文档"。这意味着我们需要掌握Python中处理...

PYTHON_PDF_TRANS:它是由PYTHON制造的。它用于翻译PDF或文本和阅读PDF

03-06

1. PyPDF2：这是一个用于读取和操作PDF文件的库，可以用于提取文本和页面信息。 2. pdfminer：这个库提供了一种详细解析PDF文档的方法，包括提取文字、布局分析等，适合进行深度处理。 3. Google Translate API 或 ...

Python 从PDF中提取图片和图片信息（坐标、宽度和高度等）

nuclear2011的博客

07-16

1562

本文介绍了如何使用Python提取PDF文档或特定页面中的图片，以及提取图片的相关信息如坐标位置、宽度和高度。

Python批量修改pdf中的固定位置的图片

qq_45930253的博客

08-30

532

代码的功能是批量修改pdf文件中的一个固定位置图像，可用于修改水印，或用其他图片覆盖。

Python提取PDF文本和图片，以及提前PDF页面中指定矩形区域的文本

m0_62283350的博客

06-22

1048

从PDF中提取内容能帮助我们获取文件中的信息，以便进行进一步的分析和处理。此外，在遇到类似项目时，提取出来的文本或图片也能再次利用。要在Python中通过代码提取PDF文件中的文本和图片，可以使用这个第三方库。具体操作方法查阅下文。Python 提取PDF文本Python 提取PDF页面中指定矩形区域的文本Python 提取PDF图片安装。

如何使用python给PDF文件加水印

太空编程

01-15

1174

Python作为编程界最火的语言，能做的事几乎你能想到的它都能干，就连抢茅台都可以，还有什么不行？！Python作为脚本编程语言，可以做很多事情。使用Python，你可以轻松地给pdf加...

###pdf转化为图片###

XBT1118的博客

10-30

491

import sys, fitz import os import datetime def pyMuPDF_fitz(pdfPath, imagePath): startTime_pdf2img = datetime.datetime.now() # 开始时间 print("imagePath=" + imagePath) pdfDoc = fitz.open(pdfPath) for pg in range(pdfDoc.pageCount): .

Python 指定区域截图

涛涛不淘

10-21

5574

可以加载在一些抢购的脚本中，把秒杀产品抢到手后，进行截图，然后继续抢下一个