使用 EasyOCR 从图像中检测文本：实践指南

最新推荐文章于 2024-08-16 10:26:14 发布

woshicver

最新推荐文章于 2024-08-16 10:26:14 发布

阅读量3.4k

点赞数 2

文章标签： python opencv 人工智能编程语言 java

本文链接：https://blog.csdn.net/woshicver/article/details/120300161

版权

本文是关于如何使用Python包EasyOCR进行OCR（光学字符识别）的实践指南。EasyOCR利用PyTorch作为后端，支持42种语言的文本检测，包括从图像中提取英文和土耳其文等多语言文本。文章详细介绍了EasyOCR的安装、库导入、图像读取以及从图像中提取和绘制文本的步骤，展示了从单行文本到多行文本的检测实例。

摘要由CSDN通过智能技术生成

什么是 OCR？

OCR 的前身是光学字符识别，它对当今的数字世界具有革命性意义。OCR 实际上是一个完整的过程，在此过程中，数字世界中存在的图像/文档被处理，文本被处理成普通的可编辑文本。

OCR的目的

OCR 是一种技术，可让你将不同类型的文档（例如扫描的纸质文档、PDF 文件或数码相机拍摄的图像）转换为可编辑和可搜索的数据。

EasyOCR 是什么？

EasyOCR 实际上是一个 Python 包，它将 PyTorch 作为后端处理程序。

EasyOCR 像任何其他 OCR（Google 的 tesseract 或任何其他）一样检测图像中的文本，但我在使用它时，我发现它是从图像中检测文本的最直接的方法，而且它将 PyTorch 作为后端处理程序，准确性更可靠。

EasyOCR 支持 42 多种语言进行检测。EasyOCR 是由 Jaided AI 公司创建的。

从图像中提取文本
- 带 GPU
- 不带 GPU
- 英文文本
- 土耳其语文本和其他语言
在图像上绘制结果
- 示例 1
- 示例 2
- 处理多行文本
1.安装核心依赖
- PyTorch
将 PyTorch 作为完整包安装可能有点棘手，因此我建议你浏览PyTorch的官方网站。当你打开其官方网站时，你将在其界面中看到下图。

现在，如果你仔细查看上图，你会发现有许多选项可供我们选择，根据我们的选择获得最兼容的命令。

让我向你展示我想提及的内容！

在上面的表示中，你可以注意到我选择了Package: pip和Compute platform: CPU，根据我的选择，我得到了命令 - pip install torchvision torchaudio。得到这个命令后，只需在你的命令提示符下运行这个命令，你的 PyTorch 库就会成功安装。
- EasyOCR
成功安装PyTorch库后，很容易安装EasyOCR库，你只需要运行以下命令:
```
pip3 install easyocr
```
然后你的命令提示符界面将如下所示：

2. 导入库
```
import os
import easyocr
import cv2
from matplotlib import pyplot as plt
import numpy as np
```
3. 读取图像
- **拍摄在线图片：**这里我