18、Application example:Photo OCR(应用举例:Photo OCR)
18.1 Problem description and pipeline(问题描述与pipeline)
Photo OCR 全称 Photo Optical Character Recognition(照片光学字符识别),其Pipeline如下所示:
18.2 Sliding windows(滑动窗口)
滑动窗口的含义是指,用一个固定大小的pixel去遍历整个照片。
18.3 Getting lots of data:Artificial data synthesis(获取大量数据和人工数据)
一个最可靠的得到高性能机器学习系统的方法是使用一个低偏差机器学习算法并且使用庞大的训练集去训练它。人工数据合成主要有两种形式:第一种是自己从零创造数据;第二种是我们已经有小的标签训练集,然后以某种方式扩充训练集。