python批量保存图像先快后慢,Pytesseract太慢了。如何使其更快地处理图像？

最新推荐文章于 2023-07-24 14:51:59 发布

周玥枫

最新推荐文章于 2023-07-24 14:51:59 发布

阅读量438

点赞数

文章标签： python批量保存图像先快后慢

I am using pytesseract in the below code:

def fnd():

for fname in list:

x = None

x = np.array([np.array(PIL.Image.open(fname))])

print x.size

for im in x:

txt = pytesseract.image_to_string(image=im).encode('utf-8').strip()

open("Output.txt","a+").write(txt)

with open("Output.txt") as openfile:

for line in openfile:

for part in line.split():

if "cyber" in part.lower():

print(line)

return

The list contains names of images from a folder (2408*3506 & 300 res Gray-scaled). Unfortunately for around 35 images the total processing time is around 1400-1500 seconds.

Is there a way I can reduce the processing time?

解决方案

Pytesseract writes and reads every image you pass it. This is unnecessary when running 35 images. Instead, you should use a python tesseract API interface. This will be significantly faster.

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

周玥枫

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python批量保存图像先快后慢,Pytesseract太慢了。如何使其更快地处理图像？

I am using pytesseract in the below code:def fnd():for fname in list:x = Nonex = np.array([np.array(PIL.Image.open(fname))])print x.sizefor im in x:txt = pytesseract.image_to_string(image=im).encode('...
复制链接

扫一扫

python程序运行速度随着时间不断变慢甚至崩溃

qq_32743513的博客

07-30

8551

Python ocr哪个速度最快,Python ocr 版面分析

最新发布

2401_84471631的博客

05-31

851

Tesseract是一款开源的OCR（Optical Character Recognition，光学字符识别）引擎，最初由HP实验室开发，在2005年后由Google接手并进一步开发和完善快码论文。Tesseract支持多种语言文字的检测和识别，包括中文、英语、德语、法语、意大利语等多种主要语言，同时也支持针对特定场景或应用的领域OCR开发。Tesseract基于机器学习技术，使用了多层神经网络以及支持向量机（SVM）等算法进行文字特征提取和识别。

参与评论您还未登录，请先登录后发表或查看评论

python读取image文件_Python 读取图像文件的性能对比

weixin_39838231的博客

11-20

124

Python 读取图像文件的性能对比使用 Python 读取一个保存在本地硬盘上的视频文件，视频文件的编码方式是使用的原始的 RGBA 格式写入的，即无压缩的原始视频文件。最开始直接使用 Python 对读取到的文件数据进行处理，然后显示在 Matplotlib 窗口上，后来发现视频播放的速度比同样的处理逻辑的 C++ 代码慢了很多，尝试了不同的方法，最终实现了在 Python 中读取并显示视频文...

python批量保存图像先快后慢_Pytesseract太慢了。如何让它更快地处理图像？

weixin_39842611的博客

12-08

312

我在下面的代码中使用pytesseract：def fnd():for fname in list:x = Nonex = np.array([np.array(PIL.Image.open(fname))])print x.sizefor im in x:txt = pytesseract.image_to_string(image=im).encode('utf-8').strip()open...

python matplotlib保存图片太慢？全网最新解决办法，速度快了一半

qq_43495412的博客

11-08

2713

matplotlib加速保存，savefig速度提升一半

python下png保存时间

周航的专栏

04-13

215

1000张1080P图片 pillow 4:00 opencv 1:30

python图像处理,python图像处理库,Python

08-09

在Python编程语言中，图像处理是一项广泛应用于各种领域的重要技能，包括数据分析、视觉艺术、机器学习等。Python提供了丰富的库来...通过掌握这些库的使用，你将能够有效地处理和分析图像，为你的项目增添更多可能。

python将处理好的图像保存到指定目录下的方法

09-19

- 另外，`io.imsave(savename, image)`是`PIL`（Python Imaging Library）或者其升级版`Pillow`库中用于保存图像的函数，也可以用来保存处理后的图像。 7. **时间计算**： - 使用`time.clock()`记录每个图像处理...

数字图像处理大作业-拍照图像处理（python+OpenCV+qt）

03-27

通过Python与OpenCV的结合，我们可以实现上述各种图像处理功能，而Qt库则可以用来构建用户界面，使得用户能够直观地操作和查看处理结果。这个大作业为学习者提供了一个完整的实践平台，涵盖了数字图像处理的多个核心...

python图像处理实验指导书1

08-03

Python 图像处理实验指导书1 Python 图像处理实验指导书1 是一个基于 Python 的图像处理实验...这个实验为我们提供了一个基本的图像处理和机器人控制的 Demo，帮助我们更好地理解图像处理和机器人控制的原理和应用。

python图像处理python图像处理

06-29

Python图像处理是一个广泛的领域，它涉及使用Python编程语言和相关库来操作、分析和修改图像。在本场景中，我们看到一系列的JPEG图像文件（tupianHD1.jpg至tupian0.jpg）以及两个Python脚本（ulit.py和image.py），...

解决tesseract安装速度慢

qq_33435148的博客

10-09

1644

安装tesseract的时候发现下载特别特别慢，其实就是那个语言包下载的慢。安装的时候就啥语言包都不要安装。去这个网站下载https://codechina.csdn.net/mirrors/tesseract-ocr/tessdata?utm_source=csdn_github_accelerator 点克隆之后下载其中一个压缩包解压了之后将文件夹里面的所有东西粘贴到tessdata这个文件夹里面就OK了。还有你需要环境变量配置，在path里面添加你的这个界面的绝对路径最后最后你必须

【无标题】python plt 带时间保存图片

qq_44217216的博客

03-15

197

【代码】【无标题】python plt 带时间保存图片。

[Python]图片保存性能对比（mmap,open,cv.imwrite）

oyjs1989的博客

01-04

374

结论：建议创建文件使用python自带的open方法。

python 多进程保存图片，速度加倍

weixin_41449637的博客

04-26

1553

Python中的多线程和多进程有所区别，这里采用多进程，作为样例么有用进程池，而是手动创建两个进程，用于保存列表中的图片单个进程的耗时： 21.24s 两个进程的耗时：10.69s 用了两个进程，耗时减半，实际应用中可以，用进程池的Queue的方式时间进程间信息共享，利用lock保证数据的安全，加lock会增加耗时，需要妥善处理 import queue import threading import os import cv2 import time from multiprocessing.

python调用摄像头录制视频_python+opencv打开摄像头,保存视频、拍照功能的实现方法...

weixin_39746652的博客

11-20

647

以下代码是保存视频# coding:utf-8import cv2import sysreload(sys)sys.setdefaultencoding('utf8')cap = cv2.VideoCapture(0)cap.set(3,640)cap.set(4,480)cap.set(1, 10.0)#此处fourcc的在MAC上有效，如果视频保存为空，那么可以改一下这个参数试试, 也可以是-...

基于Python图像处理—图像读取与储存

xiaoheihenaixiao的博客

05-16

749

基于Python的图像处理实现，编辑器VS Code，配置Python和Opencv，VSCode简洁轻便，支持插件扩展，强烈推荐。 1、图像读取 import cv2 as cv image = cv.imread("image.PNG") #读取图像 cv.namedWindow("image", cv.WINDOW_AUTOSIZE) #新建显示窗口 cv.imshow("image", image) #现实图像 cv.waitKey(0) #显示窗口时间其中：namedWindow()中参数1：

Python安装pytesseract0.3.10异常处理

qq_40689436的博客

07-24

780

使用 pytesseract + tesseract-ocr 进行验证码识别，需要安装的第三方库：pytesseract 、tesseract-ocr，在使用pytesseract 之前，必须安装tesseract-ocr，因为 pytesseract 依赖于tesseract-ocr，否则无法使用。若只是安装了pytesseract，在使用pytesseract打开图片是遇到错误，没有找到文件。

python批量快速自适应阈值化处理图像并保存到文件夹

07-17

要批量快速自适应阈值化处理图像并保存到文件夹，您可以使用以下代码： ```python import cv2 import os # 输入文件夹路径和输出文件夹路径 input_folder = 'input_folder' output_folder = 'output_folder' # ...

“相关推荐”对你有帮助么？

非常没帮助
没帮助
一般
有帮助
非常有帮助

提交