前言
最后用一个实例结束学习。
1.图片处理流程
本次任务时识别图片中的字符,处理分为3步:文本检测,字符切分,字符识别。
1.文本检测
先定义几个滑动窗口对图片进行扫描,扫描就是窗口将图片遍历一遍的过程,每次扫描得到的图片都会被二分类,识别是否存在字符。最后将所有存在字符的图片拼接汇总。
2.字符切分
同样是利用滑动窗口对有字符的图片进行扫描,然后同样是二分类问题,识别图片中是否含有完整字符。
3.字符识别
分类问题,通过监督算法识别字符(如神经网络)。
2.获得大量数据
在机器学习的过程中,我们通常需要大量数据训练模型。这些数据的获得流程有几种。比如说:从网络上下载一些标准样例(比如上述的字符识别可以采用字符库中的字符作为标准样例),对这些样例作一些魔改(比如扭曲,缩放)。或者你已经有一个样本,对这个样本进行人工改造。也可以雇人寻找数据并添加标签。
3.上限分析
以上述字符识别作为例子,我们对图片分析的每一个流程作上限分析,可以知道,每一个部分可以提升的幅度是不同的。这给我们的工作一个指示:对改进上限比较高的部分多投入精力。
总结
本章一个实际样本讲述了机器学习的实际工作流程与其他的一些工作。