《统计学习方法》三：手推“k近邻法”

最新推荐文章于 2022-05-21 15:59:53 发布

nbszg

最新推荐文章于 2022-05-21 15:59:53 发布

阅读量215

点赞数

分类专栏：机器学习数学文章标签：机器学习统计学统计模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u011517132/article/details/103687565

版权

机器学习同时被 2 个专栏收录

21 篇文章 3 订阅

订阅专栏

19 篇文章 7 订阅

订阅专栏

第三章 $k$ 近邻法

k-NN是一种基本的分类和回归方法，没有显式的表达过程。

3.1. $k$ 近邻算法
$k$ 近邻算法是给定一个训练数据集，对于新的输入实例，在训练数据集中找到与该实例最近的 $k$ 个实例。将这 $k$ 个实例中多数属于的类别作为输入实例的类别预测值。具体算法如下：
在这里插入图片描述
3.2. $k$ 近邻模型
决定 $k$ 近邻模型的三要素：距离度量、 $k$ 值的选和分类决策规则
3.2.1.模型
通过每个实例的邻域将特征空间进行划分。
3.2.2.距离度量

3.2.3. $k$ 值的选择
可知较小的 $k$ 使实例的预测的近似误差减小，但由于 $k$ 小，会对邻近的 $k$ 个实例更加敏感，容易过拟合，增大估计误差。
$k$ 值过大会减小估计误差，增大近似误差。当 $k$ 等于训练集样本个数是，总是使用训练集中样本最多的一类进行预测。

3.2.4.分类决策规则
在这里插入图片描述
3.3. $k$ 近邻法的实现： $k d$ 树
3.3.1.构造 $k d$ 树
$k d$ 树是一颗二叉树，构造 $k d$ 树相当于不断的用垂直于坐标轴的场平面将 $k$ 维空间切分，构成一系列的 $k$ 维超矩形区域（注意：此处的 $k$ 代表维度，与 $k$ 近邻法的 $k$ 无关）。
在这里插入图片描述
3.3.2.搜索kd树

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
《统计学习方法》三：手推“k近邻法”

第三章 kkk近邻法k-NN是一种基本的分类和回归方法，没有显式的表达过程。3.1.kkk近邻算法
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。