使用 Pytesseract 进行光学字符识别

最新推荐文章于 2023-12-06 22:27:48 发布

woshicver

最新推荐文章于 2023-12-06 22:27:48 发布

阅读量1.7k

点赞数

文章标签： python opencv java 深度学习计算机视觉

本文链接：https://blog.csdn.net/woshicver/article/details/122974869

版权

本文介绍了如何使用Pytesseract和OpenCV进行光学字符识别（OCR），从图像中提取文本。首先，文章讲解了安装和配置tesseract的步骤，接着展示了如何通过一系列图像处理技术，如灰度化、降噪、阈值处理、腐蚀和形态变换等，来优化图像以提高文本识别的准确性。最后，文章强调了这些技术在自动化文档处理和无纸化办公中的应用价值。

摘要由CSDN通过智能技术生成

概述

本文，我们将使用计算机视觉技术从图像中提取文本。提取文本后，我们将在该文本上应用 OpenCV 的一些基本功能来增强它并获得更准确的结果。这个项目将非常有用，因为它可以节省从图像打字的时间和精力。

范围

对于将从图像中获取文本的大型组织而言，此应用程序可能会节省时间。
它可以打开“无纸化文档”的世界，这也有助于升级存储。
它还可以帮助自动化过程，因为它可以从图像本身中获取文本。

我们将导入requests库以获取 git 文件和图像的 URL 。

#import requests to install tesseract
import requests

注意：现在要下载 tesseract 文件，只需转到我将在函数中作为参数提供的链接，但我只是提供另一种下载 tesseract 文件的方法。

# Downloading tesseract-ocr file
r = requests.get("https://raw.githubusercontent.com/tesseract-ocr/tessdata/4.00/ind.traineddata", stream = True)

将数据写入文件以避免路径问题

with open("ind.traineddata", "wb") as file:  
    for block in r.iter_content(chunk_size = 1024): 
         if block:  
            file.write(block)

我们现在将下载Pytesseract 库运行所需的tesseract，并将文件保存在open() 函数的路径中。

!pip install pytesseract

如果你想将其安装在笔记本中，此命令将安装 Pytesseract 模块。

Requirement already satisfied: pytesseract in c:programdataanaconda3libsite-packages (0.3.8)
Requirement already satisfied: Pillow in c:programdataanaconda3libsite-packages (from pytesseract) (8.0.1)

在这一步中，我们将安装 OCR 所需的库，我们还将导入 IPython 函数以清除不需要的函数。

安装光学字符识别所需的库

! apt install tesseract-ocr libtesseract-dev libmagickwand-dev

导入 IPython 以清除不重要的输出

from IPython.display import HTML, clear_output
clear_output()

现在，我们将安装Pytesseract

最低0.47元/天解锁文章

woshicver

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
使用 Pytesseract 进行光学字符识别

概述本文，我们将使用计算机视觉技术从图像中提取文本。提取文本后，我们将在该文本上应用 OpenCV 的一些基本功能来增强它并获得更准确的结果。这个项目将非常有用，因为它可以节省从图像打字的...
复制链接

扫一扫