基于CNN的文字识别--总结

最新推荐文章于 2024-04-15 15:55:39 发布

库里没投过三分

最新推荐文章于 2024-04-15 15:55:39 发布

阅读量1.1w

点赞数 1

分类专栏：深度学习文章标签： cnn 深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhaonin/article/details/51283628

版权

深度学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

一网络结构

　　　文字识别（非手写体）相对容易，ＣＮＮ网络结构基本４层就可以跑出较好的结果；模型收敛也较为容易，加上dropout收敛也很快，一两个小时就能收敛到９０％多（ｔｉｔａｎＸ）.

二训练样本

　　　当然，人力、财力、时间有保证的话，收集实际样本效果肯定会好些，没这些条件的话，人工生成样本也不错。一个字几百上千个样本基本靠谱，但是，要注意样本最好要hard。

三经验

　1　由于验证集、训练集都是自己生成的，so，通过验证集判断模型有没有过拟合就不靠谱了。。。模型熟练到98%后，就开始过拟合，而验证集准确率还在上升。。so,验证集还是人工标注生成吧
　2　在训练时，我把softmax输出类别设置为字符类别数，得到提取字符特征的模型，同时也拿来对字符分类；用模型提取的特征，当图像文字/非文字进行判断（方法包括训练分类器，或是直接在网络后面用softmax输出值进行阈值判断，小于阈值认为是非文本）时，发现效果不是太好。可能是特征提取的有问题，《Deep Features for Text Spotting》文章中在模型训练时，有一个背景类别，这样提取出的特征可能对文字、非文字区分性更强些？下一步可以试试。
　3 　犯了一些低级错误，有时候越怕麻烦越麻烦，事情还是得一步一步踏踏实实的去做，文章还是得一篇篇去读，算法还是得一个个去啃，代码还是得一行行去写，工资还是得一块块去长。。额。。我排比不下去了，哈哈～

库里没投过三分

关注

1
点赞
踩
11

收藏

觉得还不错? 一键收藏
2
评论
基于CNN的文字识别--总结

一网络结构　　　文字识别（非手写体）相对容易，ＣＮＮ网络结构基本４层就可以跑出较好的结果；模型收敛也较为容易，加上dropout收敛也很快，一两个小时就能收敛到９０％多（ｔｉｔａｎＸ）.二训练样本　　　当然，人力、财力、时间有保证的话，收集实际样本效果肯定会好些，没这些条件的话，人工生成样本也不错。一个字几百上千个样本基本靠谱，但是，要注意样本最好要hard。三经验　1　由于验证集、训练集都是
复制链接

扫一扫

专栏目录

库里没投过三分 CSDN认证博客专家 CSDN认证企业博客

码龄13年

11: 原创

41万+: 周排名

142万+: 总排名

3万+: 访问

: 等级

454: 积分

12: 粉丝

9: 获赞

17: 评论

41: 收藏

私信

关注

热门文章

分类专栏

杂记 2篇
C++ 5篇
c# 1篇
算法 6篇
特征检索 4篇
图像检索
机器学习算法 1篇
深度学习 1篇

最新评论

局部敏感哈希(原始LSH)python实现
cocohao715: 博主复制粘贴到博客上，origionalLSH文件中有些函数方法对齐错了，导致有些LSH中没有这些函数
五年，好久不见
不正经的kimol君: 在最美的年华，做最好的自己，加油！
五年，好久不见
阿J~: 先一键三连，有空慢慢研究
五年，好久不见
盼盼编程: 顶
五年，好久不见
抓手: 大佬出品，必属精品~

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。