【OCR 文字识别】Python中一个不错的OCR库-EasyOCR

东华果汁哥

已于 2023-06-07 16:00:00 修改

阅读量1.8w

点赞数 56

分类专栏：图像识别--OCR 文章标签： python ocr 开发语言

于 2021-01-12 10:06:25 首次发布

本文链接：https://blog.csdn.net/u013421629/article/details/112507026

版权

图像识别--OCR 专栏收录该内容

2 篇文章 1 订阅

订阅专栏

无意中发现了一个巨牛的人工智能教程，忍不住分享一下给大家。教程不仅是零基础，通俗易懂，而且非常风趣幽默，像看小说一样！觉得太牛了，所以分享给大家。点这里可以跳转到教程。人工智能教程

Python中有一个不错的OCR库-EasyOCR，在GitHub已有9700star。它可以在python中调用，用来识别图像中的文字，并输出为文本。

安装包：

pip install eazyocr

错误问题：

ImportError: libX11.so.6: cannot open shared object file: No such file or directory

解决方法：

sudo yum install libX11

错误问题：

ImportError: libXext.so.6: cannot open shared object file: No such file or directory

解决办法：

sudo yum install libXext

识别代码：

# 导入easyocr
import easyocr
# 创建reader对象
reader = easyocr.Reader(['ch_sim','en'])
# 读取图像
result = reader.readtext('./企业微信截图_16104127148073.png')
# 结果
print(result)
for i in result:
    word = i[1]
    print(word)

在这里插入图片描述

GPU 服务器运行 python test.py
在这里插入图片描述

在这里插入图片描述

检测部分使用了CRAFT算法，识别模型为CRNN，它由3个主要组件组成：特征提取，序列标记（LSTM）和解码（CTC）。整个深度学习过程基于Pytorch实现。

检测：CRAFT算法
识别：CNN+RNN+CTC

OCR 应用场景如下：

1.文档识别

工作或者科研学习中，要应对大量的纸质文件、书刊杂志、PDF格式的电子资料，很难对这些格式的资料进行编辑和整理

2.拍题识别

识别试卷，保存试卷中的文字并进行评测评分

3.反垃圾

计算机目前只能处理电子字符，不能直接理解图片上的字符，但经过OCR“翻译”后，计算机就能处理那些原本读不懂的信息。比如检测图片上的违禁字眼，由此开启反垃圾新技能

4.书摘笔记

读书时，看到不错的文章段落想要做书摘笔记，但又懒得去打字或是手抄整理

5.随手记录

在微信、微博等内容平台看到有价值的图片内容会随手保存Mark，或是用截屏把手机页面内容保存到相册，但这些图片信息散乱在手机各处，很难进行归纳、整理和检索

6.病历整理

医生每天需要整理大量的病历，如果使用OCR识别技术，拍图即可生成电子资料自动记录保存，节约时间

7.档案管理

档案管理员的工作有很多需要记录，如果单纯依赖打字上传确实是一项费时费力的工作

以上列举的都是生活中你可能会遇到的麻烦，但OCR所能实现的场景和可挖掘的功能远不止这些。医疗、海关、物流、金融、传统制造业等领域都能够通过OCR识别服务，为企业提供高效、低成本的数据采集方案，节省人工数据采集、构建信息系统和维护升级的成本，让企业更智能。

东华果汁哥

关注

56
点赞
踩
436

收藏

觉得还不错? 一键收藏
打赏
24
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录