Python计算机视觉编程 - 第八章图像内容分类 -knn分类及可视化、dense sift原理、手势识别

最新推荐文章于 2020-12-03 14:29:19 发布

柴达夫47

最新推荐文章于 2020-12-03 14:29:19 发布

阅读量782

点赞数 1

分类专栏：计算机视觉

本文链接：https://blog.csdn.net/weixin_43848274/article/details/90205701

版权

本文详细介绍了K-NN算法的原理，包括距离计算方式、k值选择和分类规则，并展示了K-NN的可视化效果。接着探讨了Dense SIFT特征提取的原理及其在图像识别中的应用，特别是如何用于手势识别。通过实验，观察到k值的大小对分类精度的影响，并展示了基于Dense SIFT的手势识别系统的高准确性。

摘要由CSDN通过智能技术生成

1.K-NN原理介绍

K近邻算法(K-NN)算法是一种简单但也很常用的分类算法，它也可以应用于回归计算。K-NN是无参数学习,这意味着它不会对底层数据的分布做出任何假设。它是基于实例，即该算法没有显式地学习模型。相反，它选择的是记忆训练实例，并在一个有监督的学习环境中使用。KNN算法的实现过程主要包括距离计算方式的选择、k值得选取以及分类的决策规则三部分。

1.1.距离计算方式的选择

选择一种距离计算方式,计算测试数据与各个训练数据之间的距离。距离计算方式一般选择欧氏距离或曼哈顿距离。
给定训练集: Xtrain=(x(1),x(2),x(3),…,x(i))Xtrain=(x(1),x(2),x(3),…,x(i))，测试集：Xtest=(x′(1),x′(2),x′(3),…,x′(j))Xtest=(x′(1),x′(2),x′(3),…,x′(j))
这里给出欧式距离公式：
在这里插入图片描述

1.2 k值的选取

在计算测试数据与各个训练数据之间的距离之后，首先按照距离递增次序进行排序，然后选取距离最小的k个点。
一般会先选择较小的k值，然后进行交叉验证选取最优的k值。k值较小时，整体模型会变得复杂，且对近邻的训练数据点较为敏感，容易出现过拟合。k值较大时，模型则会趋于简单，此时较远的训练数据点也会起到预测作用，容易出现欠拟合。

1.3分类的决策规则

常用的分类决策规则是取k个近邻训练数据中类别出现次数最多者作为输入新实例的类别。即首先确定前k个点所在类别的出现频率，对于离散分类，返回前k个点出现频率最多的类别作预测分类；对于回归则返回前k个点的加权值作为预测值。

2.K-NN可视化

2.1代码：

首先创建两个不同的二维点集，用pickle模块保存，一个用于训练，一个用于测试

from numpy.random import randn
import pickle
from pylab import *

# create sample data of 2D points
n = 200
# two normal distributions
class_1 = 0.6 * randn(n,2)
class_2 = 1.2 * randn(n,2) + array([5,1])
labels = hstack((ones(n),-ones(n)))
# save with Pickle
#with open('points_normal.pkl', 'w') as f:
with open('points_normal_test.pkl', 'wb') as f:
    pickle.dump(class_1,f)
    pickle.dump(class_2,f)
    pickle.dump(labels,f)
# normal distribution and ring around it
print ("save OK!")
class_1 = 0.6 * randn(n,2)
r = 0.8 * randn(n,1) + 5
angle = 2*pi * randn(n,1)
class_2 = hstack((r*co