K近邻算法:
数据:两类点方块和三角
判断绿色的点是属于方块还是三角呢?
k=3和k=5结果一样吗?
答:结果不同,k=3时绿色的点属于三角,但k=5时绿色的点属于方块。
K近邻计算流程:
1.计算已知类别数据集中点与当前点的距离
2.按照距离依次排序 :d1,d2,d3,d4........
3.选取与当前点距离最小的k个点
4.确定前k个点所在类别的出现概率
5.返回前K个点出现频率最高的类别作为当前点预测分类
用K近邻算法可以作为图像分类算法吗?
下面我们用一个例子来解释。
数据库样例:CIFAR-10
数据库简介:10类标签 50000个训练数据 10000个测试数据 大小均为32*32
测试结果:
部分结果还可以,但也有一部分分类错误。
分类错误大多是因为它们的背景占比多,所占的像素点多,但我们要进行分类的大多是图像里面的主体。
为什么K近邻不能用来做图像分类?
背景主导是一个最大的问题,我们关注的却是主体(主要成分)。