使用 OpenCV 和 Tesseract 对图像中的感兴趣区域 (ROI) 进行 OCR

最新推荐文章于 2024-04-27 16:11:04 发布

VIP文章小白学视觉

最新推荐文章于 2024-04-27 16:11:04 发布

阅读量2.2k

点赞数

文章标签：算法 python 人工智能 opencv 计算机视觉

本文链接：https://blog.csdn.net/qq_42722197/article/details/121059446

版权

点击上方“小白学视觉”，选择加"星标"或“置顶”

重磅干货，第一时间送达

在这篇文章中，我们将使用 OpenCV 在图像的选定区域上应用 OCR。在本篇文章结束时，我们将能够对输入图像应用自动方向校正、选择感兴趣的区域并将OCR 应用到所选区域。

这篇文章基于 Python 3.x，假设我们已经安装了 Pytesseract 和 OpenCV。Pytesseract 是一个 Python 包装库，它使用 Tesseract 引擎进行 OCR。因此，如果我们没有安装 tesseract 引擎，请从https://github.com/UB-Mannheim/tesseract/wiki下载并安装它，并正确设置 TESSDATA_PREFIX 环境变量和路径变量。

深入到代码中，让我们从导入所需的库开始：

# Importing necessary libraries
import numpy as np
import cv2
import math
from scipy import ndimage
import pytesseract

现在，使用 opencv 的 imread() 方法将图像文件读入 python。

IMAGE_FILE_LOCATION = "test_image.jpg" # Photo by Amanda Jones on Unsplash
input_img = cv2.imread(IMAGE_FILE_LOCATION) # image read

在直接提取感兴趣区域之前，让我们先检查它的方向，因为很多时候我们一定已经注意到文档或图像的方向不正确，这会导致 OCR 较差，所以现在我们将调整输入图像的方向以确保更好的 OCR 结果。

在这里，我们应用两种算法来检测输入图像的方

最低0.47元/天解锁文章

小白学视觉

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
使用 OpenCV 和 Tesseract 对图像中的感兴趣区域 (ROI) 进行 OCR

点击上方“小白学视觉”，选择加"星标"或“置顶”重磅干货，第一时间送达在这篇文章中，我们将使用 OpenCV 在图像的选定区域上应用 OCR。在本篇文章结束时，我们将能够对输入图像应用自动...
复制链接

扫一扫