ocr随机字符串识别

最新推荐文章于 2023-10-18 16:27:53 发布

lirunqi3

最新推荐文章于 2023-10-18 16:27:53 发布

阅读量316

点赞数

分类专栏： ocr

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lirunqi3/article/details/107845924

版权

项目旨在识别来自特殊字库的随机字符串。初期尝试使用Tesseract，但由于字符无序和字库特殊性，效果不佳。之后转向使用CRNN算法，通过调整训练参数和处理不定长字符串，最终实现接近100%的识别正确率。

摘要由CSDN通过智能技术生成

前言：

项目的主要内容是对于随机字符串进行识别，随机字符串来源于电子文件，而非照片，环境字符。并且电子文件中的字符来自一种特殊字库，所以麻烦就在于如何将这种特殊字库的字体进行识别达到99%左右的正确率？

一开始的思路：

经过调研，主要的ocr识别分为光学直接识别的tesseract，和加入了神经网络的算法（densenet\crnn）。

虽然说tesseract加了lstm增强了语义方面的识别，但是从1995年ray Smith开始在hp研发tesseract，这个算法就是针对光学方法识别，这个lstm也只是点缀。那么神经网络算法就主要是能够在检测行列定位方面更加精确，在前后文上能把握更多。

Tesseract:

由于是无序字符，随机生成，所以采用对前后文有优势的神将网络就没意义了，甚至会比较差。所以项目定位就是采用tesseract。

由于我们的字库是特殊字库，那么只能自己制作，如果采用标准英文字库，准确率惨不忍睹。

训练参考这个网址：

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

lirunqi3 CSDN认证博客专家 CSDN认证企业博客

码龄13年

37: 原创

14万+: 周排名

74万+: 总排名

4万+: 访问

: 等级

759: 积分

20: 粉丝

19: 获赞

8: 评论

84: 收藏

私信

关注

热门文章

分类专栏

爬虫 1篇
RL 1篇
github 2篇
统计学方法 1篇
ocr 1篇
日常bug 1篇
gan
硬件 2篇
语义分割 7篇
项目管理 2篇

最新评论

fiddler抓取app数据
Ense: 很多https都抓取不到
51单片机二维码识别
rory_wind: 他的意思大概是，经过分析学习，发现51的严苛环境带不动摄像头，光是储存一个图像都够呛更不用说摄影了。所以大概是转去想学习STM32了吧，那个比51高级一点，能带动摄像头和TFT，方便和上位机连接。
51单片机二维码识别
海绵宝宝^_^: 你说的这个51RAM到底是256Byte还是256KByte？前后有点矛盾，希望能说的清楚些
51单片机二维码识别
qdlyd: 说了和没说一样，关键的代码呢？怎么识别你有考虑过么？代码库真的能在51严苛的硬件环境下运行么？
openface 训练自己的训练集
xiongfan1234: index = np.argmax(bounding_box_size-offset_dist_squared*2.0) # some extra weight on the centering 这是在干什么？？？望楼主解答

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。