使用 Pytesseract 进行光学字符识别

概述

本文,我们将使用计算机视觉技术从图像中提取文本。提取文本后,我们将在该文本上应用 OpenCV 的一些基本功能来增强它并获得更准确的结果。这个项目将非常有用,因为它可以节省从图像打字的时间和精力。

c85e2158003a9820a3014b3a8d520dcd.png

范围

  • 对于将从图像中获取文本的大型组织而言,此应用程序可能会节省时间。

  • 它可以打开“无纸化文档”的世界,这也有助于升级存储。

  • 它还可以帮助自动化过程,因为它可以从图像本身中获取文本。

我们将导入requests库以获取 git 文件和图像的 URL 。

#import requests to install tesseract
import requests

注意:现在要下载 tesseract 文件,只需转到我将在函数中作为参数提供的链接,但我只是提供另一种下载 tesseract 文件的方法。

# Downloading tesseract-ocr file
r = requests.get("https://raw.githubusercontent.com/tesseract-ocr/tessdata/4.00/ind.traineddata", stream = True)

将数据写入文件以避免路径问题

with open("ind.traineddata", "wb") as file:  
    for block in r.iter_content(chunk_size = 1024): 
         if block:  
            file.write(block)

我们现在将下载Pytesseract 库运行所需的tesseract,并将文件保存在open() 函数的路径中。

!pip install pytesseract

如果你想将其安装在笔记本中,此命令将安装 Pytesseract 模块。

Requirement already satisfied: pytesseract in c:programdataanaconda3libsite-packages (0.3.8)
Requirement already satisfied: Pillow in c:programdataanaconda3libsite-packages (from pytesseract) (8.0.1)

在这一步中,我们将安装 OCR 所需的库,我们还将导入 IPython 函数以清除不需要的函数。

安装光学字符识别所需的库

! apt install tesseract-ocr libtesseract-dev libmagickwand-dev

导入 IPython 以清除不重要的输出

from IPython.display import HTML, clear_output
clear_output()

现在,我们将安装Pytesseract 和

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值