python ocr中文识别库_有什么比较好的支持中文ocr开源库？

最新推荐文章于 2024-06-25 07:58:50 发布

weixin_39708636

最新推荐文章于 2024-06-25 07:58:50 发布

阅读量670

点赞数

文章标签： python ocr中文识别库

Python 3 下的中英文OCR工具包，自带了多个训练好的识别模型（最小模型仅 4.7M），安装后即可直接使用。

欢迎扫码加入

最近更新【2020.05.29】：

主要变更：优化了对数字识别的准确度。

优化了模型结构，进一步降低了模型的大小，提升了预测速度；最小模型从原来的6.8M降为4.7M。

使用了爱因互动 Ein+自己的CDN存储模型文件，下载速度超快。

提供了预测速度更快的 shorter (-s)版预训练模型：densenet-lite-s-gru和densenet-lite-s-fc。

默认模型由之前的conv-lite-fc改为densenet-lite-fc。

预测支持使用GPU。

结合文字检测引擎

对于一般的场景图片（如照片、票据等），需要先利用场景文字检测引擎

from cnstd import CnStd

from cnocr import CnOcr

std = CnStd()

cn_ocr = CnOcr()

box_info_list = std.detect('examples/taobao4.jpg')

for box_info in box_info_list:

cropped_img = box_info['cropped_img'] # 检测出的文本框

ocr_res = cn_ocr.ocr_for_single_line(cropped_img)

print('ocr result: %s' % ''.join(ocr_res))

注：运行上面示例需要先安装

pip install cnstd

cnstdgithub.com

Update 2020.04.21: 发布 cnocr V1.1.0

模型更多，更准，更小。

更多介绍：

Update 2019.07.25: 发布 cnocr V1.0.0

cnocr发布了预测效率更高的新版本v1.0.0。具体说明见https://github.com/breezedeus/cnocr/blob/master/README_cn.mdgithub.com

主要更新如下：crnn模型支持可变长预测，提升预测效率

支持利用特定数据对现有模型进行精调（继续训练）

修复bugs，如训练时accuracy一直为0等

因为项目需要，我之前找了下已有可用的开源中文OCR工具，发现居然没有特别好用的。所以就自己封装了一个中文OCR Python包，称之为 cnocr（Chinese OCR的简称），项目地址为：https://github.com/breezedeus/cnocrgithub.com

cnocr主打使用简单，功能极简。

cnocr

cnocr是用来做中文OCR的Python 3包。cnocr自带了训练好的识别模型，所以安装后即可直接使用。

目前使用的识别模型是crnn，识别准确度约为 98.7%。

具体说明见：BreezeDeus：cnocr: 极简的中文OCR Python包zhuanlan.zhihu.com

weixin_39708636

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python ocr中文识别库_有什么比较好的支持中文ocr开源库？

Python 3 下的中英文OCR工具包，自带了多个训练好的识别模型（最小模型仅 4.7M），安装后即可直接使用。欢迎扫码加入最近更新【2020.05.29】：主要变更：优化了对数字识别的准确度。优化了模型结构，进一步降低了模型的大小，提升了预测速度；最小模型从原来的6.8M降为4.7M。使用了爱因互动 Ein+自己的CDN存储模型文件，下载速度超快。提供了预测速度更快的 shorter (-s...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。