July深度学习之线性分类器与损失函数
一、图像识别困难之处
1. 视角不同:每个事物旋转或者侧视最后的构图都完全不同
2. 尺寸大小不统一:相同内容的图片也可大可小
3. 变形:很多东西处于特殊的情形下,会有特殊的摆放和形状
4. 光影等干扰/幻象
5. 背景干扰
6. 同类内的差异(比如椅子有靠椅/吧椅/餐椅/躺椅...)
二、K最近邻法
找到训练集中最近的N个,以它们中最多的类别为结果
所以K近邻算法需要衡量样本之间的距离,那么距离如何衡量呢?
一般有以下三种方法:
这里有一个小问题就是K值的选取问题,如果你对KNN有了解的话,会知道K值的选取很关键。
那么在做图像识别时如何选取K值呢?我们可以通过做—N折交叉验证来选择K值。即把训练集分成n折,然后用n-1折训练,用第n折验证。如此反复,可以得到如下的图形,既可以选择合适的K值。
实际上,用K近邻算法做图像识别有很多问题:
- 首先,识别的准确率不高
- 其次,要记录全部的数据
- 速度慢
所以我们可以试试线性分类器。