【k近邻】Kd树的构造与最近邻搜索算法

F_D_Z

已于 2024-02-22 18:12:40 修改

阅读量915

点赞数 8

分类专栏：机器学习方法文章标签：算法机器学习学习 k近邻算法

于 2024-02-22 16:47:31 首次发布

本文链接：https://blog.csdn.net/weixin_73404807/article/details/136234584

版权

机器学习方法专栏收录该内容

22 篇文章 0 订阅

订阅专栏

【k近邻】 K-Nearest Neighbors算法原理及流程

【k近邻】 K-Nearest Neighbors算法距离度量选择与数据维度归一化

【k近邻】 K-Nearest Neighbors算法k值的选择

【k近邻】 Kd树的构造与最近邻搜索算法

【k近邻】 Kd树构造与最近邻搜索示例

Kd树是一种对K（与k近邻的k意义不同）维空间中的实例点进行存储以便对其进行快速检索的树形数据结构。

Kd树是一种二叉树，表示对K维空间的一个划分(partition)。

构造Kd树相当于不断地用垂直于坐标轴的超平面将K维空间切分，构成一系列的K维超矩形区域。Kd树的每个结点对应于一个k维超矩形区域。

算法:构造kd树

输入： $k$ 维空间数据集 $T=\{x_1,x_2,\cdots,x_N\}$ ,其中 $x_i=(x_i^{(1)},x_i^{(2)}\cdots,x_i^{(k)})^T$ $i=1,2,\cdots,N\colon$

输出： $kd$ 树。

(1)开始：构造根结点，根结点对应于包含T 的 $k$ 维空间的超矩形区域。

选择 $x^{(1)}$ 为坐标轴，以 $T$ 中所有实例的 $x^{(1)}$ 终标的中位数为切分点，将根结点对应的超矩形区域切分为两个子区域。切分由通过切分点并与坐标轴 $x^{(1)}$ 垂直的超平面实现。

由的根结点生成深度为1的左,右子结点：左子结点对应坐标 $x^{(1)}$ 小于切分点的子区域，右子结点对应于坐标 $x^{(1)}$ 大于切分点的子区域。

将落在切分超平面上的实例点保存在根结点。

(2)重复：对深度为 $j$ 的结点，选择 $x^{(l)}$ 为切分的坐标轴， $l=j({\mathrm{mod}}k)+1$ ,以该结点的区域中所有实例的 $x^{(l)}$ 坐标的中位数为切分点，将该结点对应的超矩形区域切分为两个子区域。切分由通过切分点并与坐标轴 $x^{(l)}$ 垂直的超平面实现。