机器学习 - k-近邻模型

最新推荐文章于 2023-12-27 23:06:23 发布

我要成魔

最新推荐文章于 2023-12-27 23:06:23 发布

阅读量457

点赞数

分类专栏：成魔心酸路

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/LiuXinNiBaBa/article/details/107733641

版权

成魔心酸路专栏收录该内容

11 篇文章 0 订阅

订阅专栏

k-近邻法模型实际上对应于模型空间的划分。

模型有三个基本要素：距离度量、 $k$ 值的选择、分类决策规则决定

距离度量

不同距离度量下得到的最近邻点是不同的。

k值的选择

$k$ 值较小时，相当于较小的淋雨中的训练实例进行预测，学习的近似误差会减小，但是估计误差会增大，就是说只有输入详尽的训练实例才会对预测结果起作用。如果邻近的实例点恰巧是噪声，预测就会出错。

这意味着整体模型变的复杂，容易发生过拟合。

如果选择较大的 $k$ 值，其优点是可以减小学习的估计误差，缺点是近似误差会增大，与输入实例较远的（不相似的）训练实例也会对预测起作用， $k$ 值的增大意味着模型变得简单。

$k=N$ 时，无论输入实例是什么，都将简单预测为在训练实例中最多的类，这时模型过于简单。

分类决策规则

多数表决。

多数表决法等价于经验风险最小化。

$k$ 近邻法的实现： $kd$ 树

$kd$ 树是二叉树，表示对特征空间的划分。

开始，构造根节点，根节点对应所有数据。

依此对每个特征做划分，以特征的中位数作为切分点，将数据且分为两个子区域，分别对应当前切分特征的值小于切分点和大于切分点的两个子区域，等于中位数的数据保存在当前根节点。

重复上述步骤。

停止条件：两个子区域没有实例时停止。

最近邻搜索算法

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
机器学习 - k-近邻模型

k-近邻法模型实际上对应于模型空间的划分。模型有三个基本要素：距离度量、值的选择、分类决策规则决定距离度量不同距离度量下得到的最近邻点是不同的。k值的选择值较小时，相当于较小的淋雨中的训练实例进行预测，学习的近似误差会减小，但是估计误差会增大，就是说只有输入详尽的训练实例才会对预测结果起作用。如果邻近的实例点恰巧是噪声，预测就会出错。这意味着整体模型变的复杂，容易发生过拟合。如果选择较大的值，其优点是可以减小学习的估计误差，缺点是近似误差会增大，与输入实例较远的（不相似...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。