KNN算法

htfenght

于 2018-03-07 14:17:21 发布

阅读量824

点赞数 1

分类专栏：机器学习文章标签：机器学习 KNN算法原理和实战

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/love__live1/article/details/79136740

版权

机器学习专栏收录该内容

30 篇文章 9 订阅

订阅专栏

机器学习算法完整版见fenghaootong-github

KNN算法

kNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别，则该样本也属于这个类别，并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。

三要素：k值选择、距离矢量、分类决策规则

k值选择

应用中，k值一般取一个较小的数值

如果k=3，在已有的分类样本上，这时来了一个新样本，那么这个新样本所属的类就是在最临近的三个样本中占较大比重的那一类。

距离矢量

特征空间中两个实例点的距离是两个实例点相似程度的反映
K近邻模型的特征空间的距离一般为欧式距离，也可以是 $L_p$ 距离：

$L_p(\vec{x_i},\vec{x_j}) = (\sum_{l=1}^n|x_i^{(l)}-x_i^{(l)}|^p)^{1/p}$

$\vec{x_i},\vec{x_j} \in \chi = \mathbb{R}^n$
$\vec{x_i} = (x_i^{(1)},x_i^{(2)},...,x_i^{(n)})^T$
$\vec{x_j} = (x_j^{(1)},x_j^{(2)},...,x_j^{(n)})^T$
$p \ge 1$

当p=2时，为欧式距离： $L_2(\vec{x_i},\vec{x_j}) = (\sum_{l=1}^n|x_i^{(l)}-x_i^{(l)}|^2)^{1/2}$
当p=1时，为曼哈顿距离： $L_1(\vec{x_i},\vec{x_j}) = \sum_{l=1}^n|x_i^{(l)}-x_i^{(l)}|$
当p= $\infty$ 无穷大时，为各维度距离中的最大值： $L_\infty(\vec{x_i},\vec{x_j}) = max_l|x_i^{(l)}-x_i^{(l)}|$

分类决策规则

误分类率

$\frac{1}{k}\sum_{\vec{x_i}\in N_k(\vec{x})}I(y_i\ne c_j)=1-\frac{1}{k}\sum_{\vec{x_i}\in N_k(\vec{x})}I(y_i = c_j)$

$c_j$ 表示类别

多数表决

$y = c_j = arg max_{c_j} \sum_{\overline{x_i}\in N_k(\overline{x})}I(y_i\ne c_j), i = 1,2,3,...,N; j = 1,2,3,...,K$

KNN算法经典实例

KNN算法经典实例

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
KNN算法

机器学习算法完整版见fenghaootong-github KNN算法kNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别，则该样本也属于这个类别，并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。三要素：k值选择、距离矢量、分类决策规则k值选择应用中，k值一般取...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。