统计学习方法第三章 k近邻法读书笔记

最新推荐文章于 2024-07-16 16:21:57 发布

辰明Xucy

最新推荐文章于 2024-07-16 16:21:57 发布

阅读量224

点赞数

文章标签：学习方法机器学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_50650660/article/details/127155014

版权

第三章 k近邻法

3.1 k近邻算法

k近邻算法是一种基本的分类与回归算法。

k近邻法简单直观：给定一个训练数据集，对于新输入的实例，在训练数据集中找到与该实例最邻近的k个实例，这k个实例多数属于某个类，就把该输入实例分为这个类。

算法 3.1(k近邻法)

在这里插入图片描述

在这里插入图片描述

当k=1时，为k近邻法的特殊情况，称为最近邻算法。

k近邻法没有显示的学习过程。(没办法拿到一个模型拿来计算)

3.2 k近邻模型

实际：k近邻法使用的模型对应于特征空间的划分。

模型由==距离度量、k值的选择、分类决策规则三大基本要素构成。

3.2.1 模型

当三大基本要素确定，则对于新输入的实例，他所属的类唯一的确定。

特征空间中，对于每个训练实例点，距离该点比其他点更近的所有点组成的一个区域，叫做单元(cell)。

3.2.2 距离度量

特征空间中两个实例点的距离是两个实例点相似程度的反映。

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

3.2.3 k值的选择

k值的选择会对k近邻法的结果产生重大影响

k值小	近似误差小	估计误差大	模型复杂，容易过拟合
k值大	近似误差大	估计误差小	模型简单，容易欠拟合

应用中，k一般取一个较小的值。通常采用交叉验证法选取最优的k值。

3.2.4 分类决策规则

在k近邻法中往往是多数表决。
在这里插入图片描述

在这里插入图片描述

3.3 k近邻法的实现：kd树

为了实现快速k近邻搜索。

k近邻最简单的实现方法是线性扫描。但在训练集很大的时候计算非常耗时。

3.1 构造kd树

根据中位数和维数不断进行切分，直到无法切分。

在这里插入图片描述

3.3.2 搜索kd树

在这里插入图片描述

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
统计学习方法第三章 k近邻法读书笔记

k近邻法
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。