统计学习方法（李航）--监督学习--k近邻法

我已经流浪了如此之久

已于 2022-10-22 22:06:09 修改

阅读量119

点赞数

分类专栏： # 统计学习文章标签：学习方法学习机器学习

于 2022-10-19 19:43:02 首次发布

本文链接：https://blog.csdn.net/gehueuwhgw/article/details/127411211

版权

7 篇文章 0 订阅

订阅专栏

一、k近邻算法

特征空间中，对每个训练实例点xi，距离该点比其他点更近的所有点组成一个区域，叫做单元cell。每个训练实例点拥有一个单元，所有训练实例点的单元构成对特征空间的一个划分。最近邻法将实例xi的类yi作为其单元中所有点的类标记class label。二维特征空间划分图如下：

在这里插入图片描述

在这里插入图片描述

k近邻法主要考虑的问题是：如何对训练数据进行快速k近邻搜索。
实现方法（有很多，但书中只提及了两种）
- 线性扫描 linear scan（但当训练集很大时，计算非常耗时，不可行）
- kd树 kd tree （提高k近邻搜索的效率，减少计算距离的次数）

定义

kd树是一种对k维空间中的实例点进行存储以便对其进行快速检索的树形数据结构
kd树是二叉树，表示对k维空间的一个划分
kd树的每个结点对应于一个k维超矩形区域
构造方法
- 构造根结点，使根结点对应于k维空间中包含所有实例点的超矩形区域
- 通过下面的递归方法，不断地对k维空间进行切分，生成子结点
- 递归方法如下：
算法
例题