通用印刷体文字识别_华宇OCR之手写识别

最新推荐文章于 2024-01-18 08:58:16 发布

魔王别嚣张

最新推荐文章于 2024-01-18 08:58:16 发布

阅读量677

点赞数

文章标签：通用印刷体文字识别

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_36481714/article/details/112222074

版权

华宇OCR在通用印刷体文字识别上取得了成功，但随着业务的不断深入，客户对于手写识别的需求越来越大，其他厂商也相继推出了手写识别产品，我们在评估了当前技术以及数据基础等条件后，在19年末立项了手写识别研究课题。下图是近期取得的识别效果展示：

图1 alpha版识别效果

相比于通用印刷体文字识别，手写字体的无规则、连笔、潦草、简体字等特点都导致其难度远超印刷体识别。另外，在数据方面，不能像印刷体那样通过大量合成数据提高算法精度，手写的高质量标注数据较少也是一大挑战。

我们一方面研究适合手写识别的深度学习算法，另一方面疯狂的找数据标注、研究手写数据合成和数据增强的方法。在标注数据较少的情况下，我们通过数据合成、数据增强等手段扩充了十倍数据，基于此我们训练了一个手写识别模型，综合情况下AR可达85%，在清晰的字体上AR可达92%。目前的手写识别还属于alpha版，后续我们还要优化算法、添加语言模型。正式版本，敬请期待！

魔王别嚣张

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
通用印刷体文字识别_华宇OCR之手写识别

华宇OCR在通用印刷体文字识别上取得了成功，但随着业务的不断深入，客户对于手写识别的需求越来越大，其他厂商也相继推出了手写识别产品，我们在评估了当前技术以及数据基础等条件后，在19年末立项了手写识别研究课题。下图是近期取得的识别效果展示：图1 alpha版识别效果相比于通用印刷体文字识别，手写字体的无规则、连笔、潦草、简体字等特点都导致其难度远超印刷...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。