照片OCR问题(照片光学字符识别):侧重于如何让计算机读取照片中的文字,此后计算机就可以自动根据文字去寻找照片,步骤如下:
1.读取照片中出现的文字
2.将文字从照片中分离出来,分割成成一个个字符
3.文字检测,文字分割和字符分类
滑动窗口分类器
1.定义一个图片截取框的固定形状,用这个框截取图中的一部分区域,判断里面是否有目标
2.然后将框向某一个方向移动,将截取的图片内容进行分类和判断,移动的距离成为步长或者移动参数
3.重复第二个步骤,对图片所有区域进行遍历扫描
4.用更大的截取框重复123步骤,不断对图片进行检测
1)识别文字
白色区域就为识别到可能会出现文字的区域,并进行一些出来,出现太窄的区域考虑舍去
2.字符分割与分类:训练一个字符分类器自动将字符进行分割与分类
3)字符识别
获取更多数据的几种方法
人工数据合成的几种方法
1.从0生成数据
2.扩充已有的训练集
3.标记样本,通过引入失真以生产额外的样本数据
上限分析:计算每个步骤能提供的性能提升上限
计算每个模块之后的正确率,从而在可以提升较大的模块多花时间和精力