EasyOCR – 支持超80种语言的开源图片识别项目

本文链接：https://blog.csdn.net/a13879442471/article/details/146537019

大家在做日常开发时，想必一定开发过OCR识别需求，例如：身份证号识别、银行卡号识别、菜单识别，大部分项目都是通过调用其余公司开放平台的API接口实现的，而且基本上只支持识别：中文、数字、英文，而且每次调用都要收取调用费用！

今天，手把手带大家部署一款开源ocr项目，不仅支持80多种语言和多种书写系统，包括中文、阿拉伯文和西里尔文。而且它还基于深度学习技术，提供了高精度的文字识别能力。这款开源工具便是EasyOCR，目前github上已达26.1K Star

EasyOCR：多语言光学字符识别工具详解

EasyOCR 是一个功能强大的开源OCR（光学字符识别）项目，支持80多种语言和多种书写系统，包括中文、阿拉伯文和西里尔文。

用户可以通过简单的API轻松地将图像中的文本转换为可编辑的文本。EasyOCR易于安装和使用，支持跨平台操作，适用于批量处理图像文件。对图像质量有一定要求，在处理大型图像时速度较慢，不过还是一个用户友好的OCR工具。

一. 核心功能与能力

多语言支持：EasyOCR能够识别80多种语言和所有流行的书写系统，包括拉丁文、中文、阿拉伯文、梵文、西里尔文等。

高精度识别：依托深度学习技术，EasyOCR可以准确识别各种字体、字号和印刷质量的文本。

简单易用：提供简洁的API，使得开发者可以轻松集成和使用OCR功能。

跨平台兼容性：EasyOCR可以在Windows、macOS和Linux等操作系统上运行，不受限于特定的平台。

批量处理能力：支持同时处理多个图像文件，提高了处理大量图像的效率。

实时性能：默认使用纯内存运算，以提高处理速度和响应时间。

自定义训练：允许用户根据自己的需求训练模型，提高识别准确率。

图像预处理：提供图像清理功能，可以对图像进行去噪、二值化、旋转校正等预处理操作，以提高识别精度。

二. 用户体验与界面，如何操作

目前有两种方式，如果只是想体验效果可以进体验版，要自己部署可以按方法二根据源码安装

1、使用web版体验

体验版地址：https://www.jaided.ai/easyocr/

打开web版界面如下，选择需要识别的图片文件

这里我们上传张身份证测试下

识别语言输入：ch_sim，这个对应的是简体中文，需要其余的可以参考语言映射表

点击process，一般几秒内便可识别完成，识别结果如下，可以看的出还是很精准的！

2、根据源码安装

源码地址：GitHub - JaidedAI/EasyOCR: Ready-to-use OCR with 80+ supported languages and all popular writing scripts including Latin, Chinese, Arabic, Devanagari, Cyrillic and etc.

easyOCR支持pip命令快速安装

安装与设置：EasyOCR的安装非常简单，只需使用pip命令即可完成：

安装release版本

pip install easyocr

如果想使用最新代码可以用源码安装

pip install git+git://github.com/jaidedai/easyocr.git

模型默认存储路径

🌈

windows： C:\Users\username.EasyOCR</font>

linux：/root/.EasyOCR/

导入与使用：在Python脚本中导入EasyOCR库，创建Reader对象并指定语言，然后读取图像进行文本识别：

代码实现如下：

import easyocr
 
reader = easyocr.Reader(
    lang_list=['ch_sim', 'en'], # 需要导入的语言识别模型，可以传入多个语言模型，其中英语模型en可以与其他语言共同使用
    gpu=False, # 默认为True
    download_enabled=True # 默认为True，如果 EasyOCR 无法找到模型文件，则启用下载
)
 
result = reader.readtext('id_card.jpg', detail=1 ) # 图片可以传入图片路径、也可以传入图片链接。但推荐传入图片路径，会提高识别速度。包含中文会出错。设置detail=0可以简化输出结果，默认为1
print(result)
 
readtext 返回的列表中，每个元素都是一个元组，内含三个信息：位置、文字、置信度:
[
    ([[27, 37], [341, 37], [341, 79], [27, 79]], '姓  名  爱新觉罗 。玄烨', 0.6958897643232619),
    ([[29, 99], [157, 99], [157, 135], [29, 135]], '性  别  男', 0.914532774041559),
    ([[180, 95], [284, 95], [284, 131], [180, 131]], '民蔟满', 0.4622474180193509),
    ([[30, 152], [94, 152], [94, 182], [30, 182]], '出  生', 0.6015505790710449),
    ([[110, 152], [344, 152], [344, 184], [110, 184]], '1654 年54日', 0.42167866223467815),
    ([[29, 205], [421, 205], [421, 243], [29, 243]], '住  址   北京市东城区景山前街4号', 0.6362530289101117),
    ([[105, 251], [267, 251], [267, 287], [105, 287]], '紫禁城乾清宫', 0.8425745057905053),
    ([[32, 346], [200, 346], [200, 378], [32, 378]], '公民身份证号码', 0.22538012770296922),
    ([[218, 348], [566, 348], [566, 376], [218, 376]], '000003165405049842', 0.902066405195785)
]
 
detail=0，从而只返回文字内容：
['姓  名  爱新觉罗 。玄烨', '性  别  男', '民蔟满', '出  生', '1654 年54日', '住  址  北京市东城区景山前街4号', '紫禁城 乾清宫', '公民身份证号码', '000003165405049842']

结果处理：识别结果是一个包含文本和位置信息的列表，可以根据需求进行处理和展示。

🌈

easyocr 的深度学习算法依赖于另一个著名的第三方模块 pytorch，图形处理部分则会用到 opencv、Pillow 等，所以还需要确保自己电脑上已经安装这些基础模块。

首次使用easyocr识别图片，会自动从网络中下载预训练模型。

如果下载很慢，可以直接下载模型文件：https://www.jaided.ai/easyocr/modelhub/，下载完成后不用解压直接复制粘贴于~/.EasyOCR/model/目录下。