pythonocr训练模型_cnocr: cnocr是用来做中文OCR的Python 3包。cnocr自带了训练好的识别模型,安装后即可直接使用...

English README.

cnocr 使用交流QQ群

欢迎扫码加入QQ交流群:

Release Notes

Update 2020.04.21: 发布 cnocr V1.1.0

V1.1.0对代码做了很大改动,重写了大部分训练的代码,也生成了更多更难的训练和测试数据。训练好的模型相较于之前版本的模型精度有显著提升,尤其是针对英文单词的识别。

以下列出了主要的变更:

更新了训练代码,使用mxnet的recordio首先把数据转换成二进制格式,提升后续的训练效率。训练时支持对图片做实时数据增强。也加入了更多可传入的参数。

允许训练集中的文字数量不同,目前是中文10个字,英文20个字母。

提供了更多的模型选择,允许大家按需训练多种不同大小的识别模型。

内置了各种训练好的模型,最小的模型只有之前模型的1/5大小。所有模型都可免费使用。

相较于之前版本的模型,新的模型精度有显著提升,尤其是针对英文单词的识别。新模型已经可以识别英文单词间的空格。

支持文字识别只在给定字符集中进行。 对于一些纯数字或者纯英文字母的应用场景可以带来识别率提升。

优化了对黑底白字多行文字图片的支持。

mxnet依赖升级到更新的版本了。很多人反馈mxnet 1.4.1经常找不到没法装,现在升级到>=1.5.0,<1.7.0。

Update 2019.07.25: 发布 cnocr V1.0.0

cnocr发布了预测效率更高的新版本v1.0.0。新版本的模型跟以前版本的模型不兼容。所以如果大家是升级的话,需要重新下载最新的模型文件。具体说明见下面(流程和原来相同)。

主要改动如下:

crnn模型支持可变长预测,提升预测效率

支持利用特定数据对现有模型进行精调(继续训练)

修复bugs,如训练时accuracy一直为0

依赖的 mxnet 版本从1.3.1更新至 1.4.1

cnocr

cnocr是用来做中文OCR的Python 3包。cnocr自带了训练好的识别模型,安装后即可直接使用。

cnocr主要针对的是排版简单的印刷体文字图片,如截图图片,扫描件等。cnocr目前内置的文字检测和分行模块无法处理复杂的文字排版定位。如果要用于场景文字图片的识别,需要结合其他的场景文字检测引擎使用。

本项目起源于我们自己 (爱因互动 Ein+) 内部的项目需求,所以非常感谢公司的支持。

示例

图片

OCR结果

Hello World!你好世界

铑泡胭释邑疫反隽寥缔

拇箬遭才柄腾戮胖惬炫

寿猿嗅髓孢刀谎弓供捣

马靼蘑熨距额猬要藕萼

掉江悟厉励.谌查门蠕坑

nd-chips fructed ast

zouna unpayably Raqu

ape fissioning Senat

ling oughtlins near

网络支付并无本质的区别,因为

每一个手机号码和邮件地址背后

都会对应着一个账户--这个账

户可以是信用卡账户、借记卡账

户,也包括邮局汇款、手机代

收、电话代收、预付费卡和点卡

等多种形式。

当然,在媒介越来越多的情形下,

意味着传播方式的变化。过去主流

的是大众传播,现在互动性和定制

性带来了新的挑战——如何让品牌

与消费者更加互动。

This chapter is currently only available in this web version. ebook and print will follow.

Convolutional neural networks learn abstract features and concepts from raw image pixels. Feature

Visualization visualizes the learned features by activ

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值