算法面经总结（7）KNN

只在底层奢华

于 2021-08-15 21:47:03 发布

阅读量207

点赞数

文章标签：算法机器学习概率论

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43250450/article/details/119720460

版权

1、原理

有监督分类算法，核心思想是判断一个新的值x的时候，根据它距离最近的K个点是什么类别来判断x属于哪个类别。关键是k的选取以及距离的度量。

2、距离选择

$L_{p}\left ( x_{i},x_{j}\right )=\left ( \sum_{l=1}^{n} \left | x_{i}^{l}-x_{j}^{l} \right |^{p}\right )^{\frac{1}{p}}$

p=1是曼哈顿距离，对应于L1范数

p=2是欧氏距离，对应于L2范数

p趋于无穷，是切比雪夫距离

3、k的选择

如果选择较小的K值，就相当于用较小的领域中的训练实例进行预测，“学习”近似误差会减小，只有与输入实例较近或相似的训练实例才会对预测结果起作用，与此同时带来的问题是“学习”的估计误差会增大，换句话说，K值的减小就意味着整体模型变得复杂，容易发生过拟合；

如果选择较大的K值，就相当于用较大领域中的训练实例进行预测，其优点是可以减少学习的估计误差，但缺点是学习的近似误差会增大。这时候，与输入实例较远（不相似的）训练实例也会对预测器作用，使预测发生错误，且K值的增大就意味着整体的模型变得简单，容易发生欠拟合。

K=N，则完全不足取，因为此时无论输入实例是什么，都只是简单的预测它属于在训练实例中最多的类，模型过于简单，忽略了训练实例中大量有用信息。

通常采取交叉验证选取最优值

4、三要素

k值选取，距离度量方式，分类决策的方式（分类用多数表决法，回归用平均法，最近k个样本输出的平均值）

5、流程

（1）计算已知类别数据集中的点与当前点的距离

（2）按距离递增次序排序

（3）选取与当前点距离最小的k个点

（4）统计前k个点所在类别出现的频率

（5）返回前k个点出现频率最高的类别作为当前点的预测类别

6、优缺点

优点：

既可以分类也可以回归

可以用于非线性模型

该算法比较适用于样本容量比较大的类域的自动分类，而那些样本容量比较小的类域采用这种算法比较容易产生误分类情况

训练时间复杂度比支持向量机之类的算法低

和朴素贝叶斯之类的算法比，对数据没有假设，准确度高，对异常点不敏感

由于KNN方法主要靠周围有限的邻近的样本，而不是靠判别类域的方法来确定所属的类别，因此对于类域的交叉或重叠较多的待分类样本集来说，KNN方法较其他方法更为适合

缺点：

计算量大，尤其是特征数非常多的时候

样本不平衡的时候，对稀有类别的预测准确率低

相比决策树模型，KNN模型的可解释性不强

以上内容均来源于各个版主、牛客网总结

只在底层奢华

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
算法面经总结（7）KNN

1、原理有监督分类算法，核心思想是判断一个新的值x的时候，根据它距离最近的K个点是什么类别来判断x属于哪个类别。关键是k的选取以及距离的度量。2、距离选择 p=1是曼哈顿距离，对应于L1范数 p=2是欧氏距离，对应于L2范数 p趋于无穷，是切比雪夫距离3、k的选择选择较小的k，整体模型变复杂，容易过拟合选择较大的k，减少学习的估计误差，近似误差会增大，容易欠拟合。...
复制链接

扫一扫

只在底层奢华 CSDN认证博客专家 CSDN认证企业博客

码龄6年

21: 原创

109万+: 周排名

204万+: 总排名

1万+: 访问

: 等级

49: 积分

1271: 粉丝

15: 获赞

2: 评论

71: 收藏

私信

关注

热门文章

分类专栏

模型复现 1篇

最新评论

stnet复现记录（1）：数据处理篇
qq_46297487: 您好，我运行的base，训练跑出来的结果特别低，您有什么好的解决方法吗？期待您的解答 (epoch: 200) Overall_Acc: 0.946 Mean_IoU: 0.474 0: 0.946 1: 0.002 precision_1: 0.002 recall_1: 0.052 F1_1: 0.004
stnet复现记录（1）：数据处理篇
LaoYuanPython: 博主在CSDN的成长史开始了！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。