照片OCD问题,滑动窗口分类器,上限分析

照片OCR问题(照片光学字符识别):侧重于如何让计算机读取照片中的文字,此后计算机就可以自动根据文字去寻找照片,步骤如下:

1.读取照片中出现的文字

2.将文字从照片中分离出来,分割成成一个个字符

3.文字检测,文字分割和字符分类

滑动窗口分类器

1.定义一个图片截取框的固定形状,用这个框截取图中的一部分区域,判断里面是否有目标

2.然后将框向某一个方向移动,将截取的图片内容进行分类和判断,移动的距离成为步长或者移动参数

3.重复第二个步骤,对图片所有区域进行遍历扫描

4.用更大的截取框重复123步骤,不断对图片进行检测

1)识别文字

白色区域就为识别到可能会出现文字的区域,并进行一些出来,出现太窄的区域考虑舍去 

2.字符分割与分类:训练一个字符分类器自动将字符进行分割与分类

 

3)字符识别 

 

获取更多数据的几种方法

人工数据合成的几种方法

1.从0生成数据

2.扩充已有的训练集

3.标记样本,通过引入失真以生产额外的样本数据 

 

 

上限分析:计算每个步骤能提供的性能提升上限

 

计算每个模块之后的正确率,从而在可以提升较大的模块多花时间和精力

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值