K近邻解析统计学习方法李航

最新推荐文章于 2022-07-31 23:26:18 发布

happy org

最新推荐文章于 2022-07-31 23:26:18 发布

阅读量457

点赞数

分类专栏：机器学习文章标签：统计学李航算法 knn算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/happyorg/article/details/78289268

版权

机器学习专栏收录该内容

14 篇文章 1 订阅

订阅专栏

K近邻（knn）是一种基本的分类与回归方法。
k近邻输入的实例为特征向量，输出为实例的类别。可以取很多类。
k近邻实际上利用训练数据集对特征向量空间进行划分，并作为其分类的“模型”。
k值的选择距离度量分类决策规则是K近邻的三要素。
K近邻算法简单、直观：给定一个数据集，对于新输入的实例，在训练数据集中找到与该实例最近邻的k个实例，这k个实例的多数属于某个类，就把该输入实例分为这个类。

特征空间中两个实例点的距离是两个实例点相似程度的反映。
这里写图片描述

K值的选择：

如果选择较小的K值，那么相当于用较小的邻域中的训练实例进行预测，这样学习的近似误差会减小，但是模型会变复杂，容易发生过拟合。如果周围恰巧是噪声，那就容易预测错误。

如果选择较大的K值，那么相当于用较大的邻域中的训练实例进行预测，这样学习的近似误差增大，但是模型会变简单，离预测点比较远的点也会对预测起作用，（相关度不大），使预测发生错误。

在应用中，k值一般选取一个比较小的数字，通常采用交叉验证法来选取最优的K值。

分类决策规则：
分类决策为多数表决。
多数表决等价于经验风险最小化。

KD树的构建和搜索统计学习方法写的很清楚，再次就不叙述。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。