什么是 OCR?
OCR 的前身是光学字符识别,它对当今的数字世界具有革命性意义。OCR 实际上是一个完整的过程,在此过程中,数字世界中存在的图像/文档被处理,文本被处理成普通的可编辑文本。
OCR的目的
OCR 是一种技术,可让你将不同类型的文档(例如扫描的纸质文档、PDF 文件或数码相机拍摄的图像)转换为可编辑和可搜索的数据。
EasyOCR 是什么?
EasyOCR 实际上是一个 Python 包,它将 PyTorch 作为后端处理程序。
EasyOCR 像任何其他 OCR(Google 的 tesseract 或任何其他)一样检测图像中的文本,但我在使用它时,我发现它是从图像中检测文本的最直接的方法,而且它将 PyTorch 作为后端处理程序,准确性更可靠。
EasyOCR 支持 42 多种语言进行检测。EasyOCR 是由 Jaided AI 公司创建的。
目录
安装核心依赖
导入库
读取图像
通过网址
本地
从图像中提取文本
-
带 GPU
不带 GPU
英文文本
土耳其语文本和其他语言
在图像上绘制结果
-
示例 1
示例 2
处理多行文本
1.安装核心依赖
PyTorch
将 PyTorch 作为完整包安装可能有点棘手,因此我建议你浏览PyTorch的官方网站。当你打开其官方网站时,你将在其界面中看到下图。
现在,如果你仔细查看上图,你会发现有许多选项可供我们选择,根据我们的选择获得最兼容的命令。
让我向你展示我想提及的内容!
在上面的表示中,你可以注意到我选择了Package: pip和Compute platform: CPU,根据我的选择,我得到了命令 - pip install torchvision torchaudio。得到这个命令后,只需在你的命令提示符下运行这个命令,你的 PyTorch 库就会成功安装。
EasyOCR
成功安装PyTorch库后,很容易安装EasyOCR库,你只需要运行以下命令:
pip3 install easyocr
然后你的命令提示符界面将如下所示:
2. 导入库
import os import easyocr import cv2 from matplotlib import pyplot as plt import numpy as np
3. 读取图像
**拍摄在线图片:**这里我