机器学习-k近邻法

最新推荐文章于 2022-10-29 20:49:30 发布

Garker-gan

最新推荐文章于 2022-10-29 20:49:30 发布

阅读量123

点赞数

分类专栏：机器学习文章标签：机器学习分类算法

本文链接：https://blog.csdn.net/weixin_37443412/article/details/125280461

版权

机器学习专栏收录该内容

11 篇文章 0 订阅

订阅专栏

k近邻法

k近邻法是一种基本分类和回归方法。k值的选择，距离度量和分类决策规则是k近邻法的三个要素。

1 k近邻算法

输入：训练集 $T={(x_1,y_1),(x_2,y_2),...,(x_i,yi)}$ ,其中 $x_i\in X= R^n, y_i \in Y={c_1, c_2,...,c_k}$
输出：实例x所属的类y。
(1)根据给定的距离度量，在训练集T中找出与x最邻近的k个点，涵盖这k个点的x的邻域记作 $N_k(x)$
(2)在 $N_k(x)$ 中根据分类决策规则决定x的类别y
$y=\argmax_{c_j}\sum_{x \in N_k(x)} I(y_i=c_j),i=1,2...,N;j=1,2,...,K$
I为指示函数， $y_i=c_j$ 时I为1，否则为0.

2 k近邻模型

k近邻法是将特征共空间根据要素划分为一些子空间,子空间的区域叫做单元(cell).
在这里插入图片描述

2.1 距离度量

关于 $x_i,x_j$ 的 $L_p$ 距离定义为:
$L_p(x_i,x_j)=(\sum_{l=1}^{n}|x_i^l-x_j^l|^p)^\frac1p$
如果p=2,表示欧式距离
$L_p(x_i,x_j)=(\sum_{l=1}^{n}|x_i^l-x_j^l|^2)^\frac12$
如果p=1,表示曼哈顿距离
$L_p(x_i,x_j)=\sum_{l=1}^{n}|x_i^l-x_j^l|$
如果p= $\infty$ ,为各个坐标距离的最大值
$L_p(x_i,x_j)=\max_l|x_i^l-x_j^l|$
在这里插入图片描述