照片OCD问题，滑动窗口分类器，上限分析

最新推荐文章于 2024-07-04 06:38:31 发布

明夜不点灯

最新推荐文章于 2024-07-04 06:38:31 发布

阅读量278

点赞数

分类专栏：机器学习文章标签： python 机器学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/woahxy/article/details/125965453

版权

机器学习专栏收录该内容

28 篇文章 2 订阅

订阅专栏

照片OCR问题（照片光学字符识别）：侧重于如何让计算机读取照片中的文字，此后计算机就可以自动根据文字去寻找照片，步骤如下：

1.读取照片中出现的文字

2.将文字从照片中分离出来，分割成成一个个字符

3.文字检测，文字分割和字符分类

滑动窗口分类器

1.定义一个图片截取框的固定形状，用这个框截取图中的一部分区域，判断里面是否有目标

2.然后将框向某一个方向移动，将截取的图片内容进行分类和判断，移动的距离成为步长或者移动参数

3.重复第二个步骤，对图片所有区域进行遍历扫描

4.用更大的截取框重复123步骤，不断对图片进行检测

1）识别文字

白色区域就为识别到可能会出现文字的区域，并进行一些出来，出现太窄的区域考虑舍去

2.字符分割与分类：训练一个字符分类器自动将字符进行分割与分类

3）字符识别

获取更多数据的几种方法

人工数据合成的几种方法

1.从0生成数据

2.扩充已有的训练集

3.标记样本，通过引入失真以生产额外的样本数据

上限分析：计算每个步骤能提供的性能提升上限

计算每个模块之后的正确率，从而在可以提升较大的模块多花时间和精力

明夜不点灯

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。