机器学习--k-近邻（kNN, k-NearestNeighbor）算法

最新推荐文章于 2023-02-23 22:58:16 发布

SUNNY小飞

最新推荐文章于 2023-02-23 22:58:16 发布

阅读量1.6k

点赞数

分类专栏：机器学习文章标签：机器学习机器学习算法 k-近邻算法 KNN

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_34290470/article/details/101834004

版权

K-近邻（KNN）算法是机器学习中一种简单的分类方法，基于实例学习和懒惰学习。算法通过计算测试样本与训练集中样本的距离，选择最近的k个点，根据这些点的多数类别来决定测试样本的分类。K的选择至关重要，太小易受噪声影响，太大可能导致过拟合。通常采用交叉验证来确定最佳K值。KNN在处理边界不规则和样本不均衡的数据集时表现出色，但计算复杂度高，适用于小规模数据集。为提高效率，可以利用kd-tree等数据结构。

摘要由CSDN通过智能技术生成

机器学习--k-近邻（kNN, k-NearestNeighbor）算法

一、算法概述

邻近算法，或者说K最近邻(kNN，k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻，就是k个最近的邻居的意思，说的是每个样本都可以用它最接近的k个邻居来代表。
Cover和Hart在1968年提出了最初的邻近算法。
KNN是一种分类(classification)算法，它输入基于实例的学习（instance-based learning），属于懒惰学习（lazy learning）即KNN没有显式的学习过程，也就是说没有训练阶段，数据集事先已有了分类和特征值，待收到新样本后直接进行处理。与急切学习（eager learning）相对应。
KNN是通过测量不同特征值之间的距离进行分类。

　　提到KNN，网上最常见的就是下面这个图，可以帮助大家理解。

　　我们要确定绿点属于哪个颜色（红色或者蓝色），要做的就是选出距离目标点距离最近的k个点，看这k个点的大多数颜色是什么颜色。

当k取3的时候，我们可以看出距离最近的三个，分别是红色、红色、蓝色，因此得到目标点为红色。

【算法原理】

如果一个样本在特征空间中

最低0.47元/天解锁文章

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
打赏
0
评论
机器学习--k-近邻（kNN, k-NearestNeighbor）算法

机器学习--k-近邻（kNN, k-NearestNeighbor）算法一、算法概述邻近算法，或者说K最近邻(kNN，k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻，就是k个最近的邻居的意思，说的是每个样本都可以用它最接近的k个邻居来代表。 Cover和Hart在1968年提出了最初的邻近算法。 KNN是一种分类(classific...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

SUNNY小飞 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。