python 文字识别 准确率_关于OCR图片文本检测、推荐一个 基于深度学习的Python 库!...

本文介绍了Python OCR库EasyOCR,它基于深度学习,支持70多种语言,准确率高,能进行文本检测。相比pytesseract,EasyOCR在中文识别上表现更优,且支持GPU加速。文章详细阐述了EasyOCR的安装、使用方法,包括detect、recognize和readtext等方法。
摘要由CSDN通过智能技术生成

大家好,我是 zeroing~

1,前言

之前谈到图片文本 OCR 识别时,写过一篇文章介绍了一个 Python 包 pytesseract ,具体内容可参考

介绍一个Python 包 ,几行代码可实现 OCR 文本识别!这篇文章 ,pytesseract 包是基于 Tesseract 封装得到的,这个包虽然支持多语言文本识别,但对于不同语言文本识别,准确率却不一样,例如英文识别准确率高,而中文文本较低;

英文字符识别,整体来看基本不会出错,但对于图片中的中文字符,经常出现乱码、识别失败,

2,EasyOCR 介绍

今天将介绍一个的用于 文本OCR 新的Python 包 EasyOCR ,这个包是基于训练好的 Deep Learning 模型开发的,模型包含功能:文本检测、文本识别

EasyOCR 包从开源到现在 10 个月不到,但在 Github 已经有 10k+ star,到目前为止经过四次版本迭代,有以下几个特点:

1,到目前为止 支持70+种语言文本识别,包括但不限于 英语、中文、日语、韩语等;

2,源于深度学习技术,识别精度很高;对于正常图片文本识别来说,准确率能达到 100% ;

223e49f19d43

image-20210121151536805

3,不仅适用于单语言,同样也适用于多语言(例如一张图片中需要同时识别中文、英语、日语三类语言);

223e49f19d43

image-20210121151525119

4,支持 GPU 加速,GPU 识别速度要比 CPU 快 6~7 倍;(需要提前配置好 cuda、 pytorch、torchvision Python 环境);

对比传统 OCR 只具有图片文本识别之外,EasyOCR 还具有 文本检测 功能(图片中识别到的文本框,在图片中的定位以 左上、右上、右下、左下 坐标顺序依次返回),效果如下图:

223e49f19d43

image-20210121000941176

上图中 EasyOCR 最终输出的是右图的 文本信息 ,左图中的红色线框是后面经处理加上去的

3,EasyOCR 使用

上面对 EasyOCR 程序包做了简单介绍,下面介绍一下它的基本用法

安装

EasyOCR 已经上传到 Pypi 上面了,可通过 pip 命令完成安装

pip install easy
  • 2
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值