机器学习面试准备（一）KNN

最新推荐文章于 2024-10-18 09:09:15 发布

开始学AI

最新推荐文章于 2024-10-18 09:09:15 发布

阅读量288

点赞数 1

分类专栏：面试文章标签：机器学习面试

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41964545/article/details/125439817

版权

面试专栏收录该内容

2 篇文章 0 订阅

订阅专栏

目录

一、简述一下KNN算法的原理?

二、KNN算法的三要素

三、如何理解K值的选择

四、kd树是什么及其作用？

五、KNN的优缺点

一、简述一下KNN算法的原理?

KNN（K-Nearest Neighbor）是一种基本的分类与回归方法，给定一个训练数据集，对于新的输入实例，在数据集中找到与该实例的最邻近的K个实例，如果这K个实例的多数属于某个类，就把该输入实例归为这一类。

KNN不具备显示的学习过程，实际上是利用训练数据集对特征空间进行划分，并作为其分类的模型。

二、KNN算法的三要素

距离度量：一般采用LP距离。（P=1，曼哈顿距离；P=2，欧氏距离；P=∞，切比雪夫距离）

K值选择：一般选取一个比较小的数，通常选择交叉验证的方法来选取最佳的K值。

分类决策规则：一般采用多数表决规则

三、如何理解K值的选择

如果K值选择较小，就相当于用较小领域中的训练实例去预测，“学习”的近似误差会减小，但估计误差会增大，如果邻近的点是噪声，预测就会出错。另外，K值的减小意味着整体模型变得复杂，容易发生过拟合。

如果K值选择较大，就相当于用较大领域中的训练实例去预测，学习的估计误差会减小，近似误差会增大，此时与输入实例较远（不相似的）实例也会对预测起作用，使预测发生错误，K值增大意味着整体的模型变得简单。

在应用中，一般选取一个比较小的数，通常选择交叉验证的方法来选取最佳的K值。

四、kd树是什么及其作用？

KNN最简单的实现方法是线性扫描，因为要对每个实例计算距离，所以当训练集很大，训练实例维度很高，计算会非常耗时。为了提高KNN搜索的效率，可以采用kd树来存储数据

五、KNN的优缺点

参考：

《统计学习方法》

简博士的个人空间_哔哩哔哩_Bilibili

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

开始学AI 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。