图片内容分类

最新推荐文章于 2023-09-22 19:29:59 发布

海Neil-828

最新推荐文章于 2023-09-22 19:29:59 发布

阅读量2.3k

点赞数 1

分类专栏：计算机视觉 python 文章标签： KNN dsift 手势识别图片内容分类

本文链接：https://blog.csdn.net/weixin_44037639/article/details/90321800

版权

本文探讨了KNN（K-Nearest Neighbor）的原理与可视化实现，展示了K值对分类效果的影响。接着，介绍了稠密SIFT（dense SIFT）的概念和应用场景，并提供了其实现代码。最后，文章详细阐述了二维手势识别，通过训练和测试数据集分析了KNN在手势识别中的性能，指出样本数量和质量对识别准确率的重要影响。

摘要由CSDN通过智能技术生成

KNN可视化与dsift原理以及手势识别的实现

文章目录

KNN可视化与dsift原理以及手势识别的实现

1、KNN可视化

1.1、K邻近分类法

1、介绍：
    在分类方法当中，最简单并且应用最多的方法之一就是KNN（K-Nearest Neighbor，K邻近分类法），这种算法把要分类的对象与训练集中已知类标记的所有对象进行类比，并由k邻近对指派到哪个类进行投票。
    KNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别，则该样本也属于这个类别，并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。 kNN方法在类别决策时，只与极少量的相邻样本有关。由于kNN方法主要靠周围有限的邻近的样本，而不是靠判别类域的方法来确定所属类别的，因此对于类域的交叉或重叠较多的待分样本集来说，kNN方法较其他方法更为适合。
在这里插入图片描述
    上图图中，绿色圆要被决定赋予哪个类，是红色三角形还是蓝色四方形？如果K=3，由于红色三角形所占比例为2/3，绿色圆将被赋予红色三角形那个类，如果K=5，由于蓝色四方形比例为3/5，因此绿色圆被赋予蓝色四方形类。

算法步骤：
1）计算测试数据与各个训练数据之间的距离；
2）按照距离的递增关系进行排序；
3）选取距离最小的K个点；
4）确定前K个点所在类别的出现频率；
5）返回前K个点中出现频率最高的类别作为测试数据的预测分类。

2、性能分析：
KNN的基本思想与计算过程很简单，你只需要考虑两件事：

1）K预设值取多少？
2）如何定义距离？

其中如何定义距离这个需要结合具体的业务应用背景，本文不细致讨论，这里只讨论K取值时对算法性能的影响。
在这里插入图片描述
在上图中，紫色虚线是贝叶斯决策边界线，也是最理想的分类边界，黑色实线是KNN的分类边界。
可以发现：K越小，分类边界曲线越光滑，偏差越小，方差越大；K越大，分类边界曲线越平坦，偏差越大，方差越小。
所以即使简单如KNN，同样要考虑偏差和方差的权衡问题，表现为K的选取。

3、KNN特点：KNN的优点就是简单直观，无需拟合参数，在样本本身区分度较高的时候效果会很不错；但缺点是当样本量大的时候，找出K个最邻近点的计算代价会很大，会导致算法很慢，此外KNN的可解释性较差。

1.2、KNN可视化实现

k值被定为3，PCV库中的knn.py中的默认k值
在这里插入图片描述
首先建立简单的二维示例数据集，下面的脚本将创建两个不同的二维点集，用Pickle模块来保存创建数据：

# -*- coding: utf-8 -*-
from numpy.random import randn
import pickle
from pylab import *

# create sample data of 2D points
n = 200
# two normal distributions
class_1 = 0.6 * randn(n,2)
class_2 = 1.2 * randn(n,2) + array([5,1])
labels = hstack((ones(n),-ones(n)))
# save with Pickle
#with open('points_normal.pkl', 'w') as f:
with open('points_normal_test.pkl', 'wb') as f:
    pickle.dump(class_1,f)
    pickle.dump(class_2,f)
    pickle.dump(labels,f)
# normal distribution and ring around it
print ("save OK!")
class_1 = 0.6 * randn(n,2)
r = 0.8 * randn(n,1) + 5
angle = 2*pi * randn(n,1)