python ocr中文识别库_有什么比较好的支持中文ocr开源库?

Python 3 下的中英文OCR工具包,自带了多个训练好的识别模型(最小模型仅 4.7M),安装后即可直接使用。

欢迎扫码加入

最近更新 【2020.05.29】:

主要变更:优化了对数字识别的准确度。

优化了模型结构,进一步降低了模型的大小,提升了预测速度;最小模型从原来的6.8M降为4.7M。

使用了爱因互动 Ein+自己的CDN存储模型文件,下载速度超快。

提供了预测速度更快的 shorter (-s)版预训练模型:densenet-lite-s-gru和densenet-lite-s-fc。

默认模型由之前的conv-lite-fc改为densenet-lite-fc。

预测支持使用GPU。

结合文字检测引擎

对于一般的场景图片(如照片、票据等),需要先利用场景文字检测引擎

from cnstd import CnStd

from cnocr import CnOcr

std = CnStd()

cn_ocr = CnOcr()

box_info_list = std.detect('examples/taobao4.jpg')

for box_info in box_info_list:

cropped_img = box_info['cropped_img'] # 检测出的文本框

ocr_res = cn_ocr.ocr_for_single_line(cropped_img)

print('ocr result: %s' % ''.join(ocr_res))

注:运行上面示例需要先安装

pip install cnstd

cnstd​github.com

Update 2020.04.21: 发布 cnocr V1.1.0

模型更多,更准,更小。

更多介绍:

Update 2019.07.25: 发布 cnocr V1.0.0

cnocr发布了预测效率更高的新版本v1.0.0。具体说明见https://github.com/breezedeus/cnocr/blob/master/README_cn.md​github.com

主要更新如下:crnn模型支持可变长预测,提升预测效率

支持利用特定数据对现有模型进行精调(继续训练)

修复bugs,如训练时accuracy一直为0等

因为项目需要,我之前找了下已有可用的开源中文OCR工具,发现居然没有特别好用的。 所以就自己封装了一个中文OCR Python包,称之为 cnocr(Chinese OCR的简称),项目地址为:https://github.com/breezedeus/cnocr​github.com

cnocr主打使用简单,功能极简。

cnocr

cnocr是用来做中文OCR的Python 3包。cnocr自带了训练好的识别模型,所以安装后即可直接使用。

目前使用的识别模型是crnn,识别准确度约为 98.7%。

具体说明见:BreezeDeus:cnocr: 极简的中文OCR Python包​zhuanlan.zhihu.comv2-2ea4b9a418227eba0c01b6ed59eb963d_180x120.jpg

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值