The photo OCR problem
Photo OCR 全称 Photo Optical Character Recognition,即图像识别。例如识别下图中的文字:
文字识别的一般步骤如下:
1. 检测文字所在的区域;
2. 字符拆分;
3. 字符识别。
Sliding windows
采用滑窗策略来检测目标所在区域。如下图红框均为包含识别目标的滑动框:
Photo OCR 全称 Photo Optical Character Recognition,即图像识别。例如识别下图中的文字:
文字识别的一般步骤如下:
1. 检测文字所在的区域;
2. 字符拆分;
3. 字符识别。
采用滑窗策略来检测目标所在区域。如下图红框均为包含识别目标的滑动框: