轻量级OCR模型发布，大小仅4MB

最新推荐文章于 2024-08-27 18:12:48 发布

置顶 kerlomz

最新推荐文章于 2024-08-27 18:12:48 发布

阅读量1.6k

点赞数

分类专栏： OCR CRNN 文章标签：深度学习计算机视觉机器学习人工智能 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/kerlomz/article/details/106437476

版权

OCR 同时被 2 个专栏收录

11 篇文章 1 订阅

订阅专栏

3 篇文章 0 订阅

订阅专栏

本模型适用于 https://github.com/kerlomz/captcha_platform 项目
基于最流行的CRNN识别单行文本，网上也有不少大佬们的项目，也提供了对应的模型，本项目旨在推广通用图像分类训练框架，希望大家对他的用途不仅仅是用来识别验证码，它能有更大的作用。

CRNN

笔者使用的网络为笔者框架内置的CNNX+GRU+CTC组合，其实效果都大同小异。网上使用VGG的众多，其实对于中文文档类的简单场景OCR，可以在特征提取网络上做一些适当的精简。

CNNX网络设计详见：https://github.com/kerlomz/captcha_trainer/blob/master/network/CNN.py#L38

该模型使用 https://github.com/kerlomz/captcha_trainer 项目进行训练
别看它以Captcha开头，他并非专为验证码而生，它也用于练普通的场景文字识别等，它其实是一个通用的图像分类框架。

测试图：

识别结果：

测试识别400x32尺寸的一张图大概耗时20ms，300x32尺寸大概12ms。模型体积约4mb，包含了近6k的中英文符号的庞大字符集。足可谓是轻量级的OCR模块了，大家可自行搭配文本目标检测如CTPN，可将分割出的行图片合成一个批次进行预测，可减少请求耗时。

模型使用：

使用 https://github.com/kerlomz/captcha_platform 项目进行部署：
将下载后的 common-ocr.zip 解压，得到 graph 和 model 两个路径。
放置于 captcha_platform 项目根目录即可，若不想安装环境可以使用链接中的编译版进行部署。

Windows:
双击 captcha_platform_tornado.exe 或使用命令行执行（若遇闪退）

Ubuntu:
使用./captcha_platform_tornado 启动即可，可配合 nohup 后台运行。

MacOS:
使用方法与Ubuntu一致。

模型下载：

链接: https://pan.baidu.com/s/1RBaSeSdp8QGdexXOTh4H4Q
提取码：o97o

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。