概述
本文,我们将使用计算机视觉技术从图像中提取文本。提取文本后,我们将在该文本上应用 OpenCV 的一些基本功能来增强它并获得更准确的结果。这个项目将非常有用,因为它可以节省从图像打字的时间和精力。
范围
对于将从图像中获取文本的大型组织而言,此应用程序可能会节省时间。
它可以打开“无纸化文档”的世界,这也有助于升级存储。
它还可以帮助自动化过程,因为它可以从图像本身中获取文本。
我们将导入requests库以获取 git 文件和图像的 URL 。
#import requests to install tesseract
import requests
注意:现在要下载 tesseract 文件,只需转到我将在函数中作为参数提供的链接,但我只是提供另一种下载 tesseract 文件的方法。
# Downloading tesseract-ocr file
r = requests.get("https://raw.githubusercontent.com/tesseract-ocr/tessdata/4.00/ind.traineddata", stream = True)
将数据写入文件以避免路径问题
with open("ind.traineddata", "wb") as file:
for block in r.iter_content(chunk_size = 1024):
if block:
file.write(block)
我们现在将下载Pytesseract 库运行所需的tesseract,并将文件保存在open() 函数的路径中。
!pip install pytesseract
如果你想将其安装在笔记本中,此命令将安装 Pytesseract 模块。
Requirement already satisfied: pytesseract in c:programdataanaconda3libsite-packages (0.3.8)
Requirement already satisfied: Pillow in c:programdataanaconda3libsite-packages (from pytesseract) (8.0.1)
在这一步中,我们将安装 OCR 所需的库,我们还将导入 IPython 函数以清除不需要的函数。
安装光学字符识别所需的库
! apt install tesseract-ocr libtesseract-dev libmagickwand-dev
导入 IPython 以清除不重要的输出
from IPython.display import HTML, clear_output
clear_output()
现在,我们将安装Pytesseract 和