机器学习——k近邻法KNN

最新推荐文章于 2023-05-27 13:55:11 发布

小小硕、

最新推荐文章于 2023-05-27 13:55:11 发布

阅读量178

点赞数

分类专栏：机器学习文章标签：算法机器学习人工智能

本文链接：https://blog.csdn.net/weixin_41676930/article/details/116085929

版权

机器学习专栏收录该内容

9 篇文章 0 订阅

订阅专栏

机器学习——k近邻法

k

近邻法(

k

-nearest neighber,

k

-NN)是一种基本分类与回归方法。

$k$ 近邻算法

输出：实例 $x$ 所属的类 $y$ 。
(1) 根据给定的距离度量，在训练集 $T$ 中找出与 $x$ 最邻近的 $k$ 个点，涵盖这 $k$ 个点的 $x$ 的邻域记作 $N_k(x)$
(2) 在 $N_k(x)$ 中根据分类决策规则（如多数表决）决定x的类别
$\arg \max _ { c _ { j } } \sum _ { x _ { i } \in N _ { k } ( x ) } I \left( y _ { i } = c _ { j } \right) , \quad i = 1,2 , \cdots , N ; j = 1,2 , \cdots , K$

$k$ 近邻模型

距离度量

$\left( x _ { i } , x _ { j } \right) = \left( \sum _ { l = 1 } ^ { n } \left| x _ { i } ^ { ( l ) } - x _ { j } ^ { ( l ) } \right| ^ { p } \right) ^ { \frac { 1 } { p } }$
当 $p = 2$ 时，为欧式距离。当 $p = 1$ 时，为曼哈顿距离。当 $p = i n f$ 时，是各个坐标距离的最大值，称为切比雪夫距离。

$k$ 值的选择

$k$ 值的减小意味着整体模型变得复杂，容易发生过拟合。 $k$ 值的增大就意味着整体的模型变得简单。通常采用交叉验证法来选取最优的 $k$ 值。

$k d$ 树

对训练数据进行快速 $k$ 近邻搜索可以采用 $k d$ 树的方法。
$k d$ 树是二叉树，构成一系列的 $k$ 维超矩形区域，每个结点对应于一个 $k$ 维超矩形区域。详细参见【数学】kd 树算法之详细篇。

小小硕、

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习——k近邻法KNN

k近邻法kkk近邻算法kkk近邻模型距离度量kkk值的选择kkk近邻法(kkk-nearest neighber, kkk-NN)是一种基本分类与回归方法。kkk近邻算法输出：实例xxx所属的类yyy。(1) 根据给定的距离度量，在训练集TTT中找出与xxx最邻近的kkk个点，涵盖这kkk个点的xxx的邻域记作Nk(x)N_k(x)Nk(x)(2) 在Nk(x)N_k(x)Nk(x)中根据分类决策规则（如多数表决）决定x的类别y=arg⁡max⁡cj∑xi∈Nk(x)I(yi=cj),i=1
复制链接

扫一扫