机器学习算法之二KD树

最新推荐文章于 2024-05-07 19:32:39 发布

weixin_38871988

最新推荐文章于 2024-05-07 19:32:39 发布

阅读量977

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_38871988/article/details/109525299

版权

KD树是一种用于k近邻搜索的数据结构，尤其适用于高维空间和大规模训练数据集。通过递归地用垂直坐标轴的超平面切分，KD树能有效地减少计算距离的次数，提高搜索效率。构建方法包括选择坐标轴和切分点，形成平衡二叉树。在最近邻域搜索中，KD树通过回溯和判断超平面相交情况来确定最近邻点。

摘要由CSDN通过智能技术生成

KD树
实现k近邻算法时，主要考虑的问题是如何对训练数据进行快速k近邻搜索。

这在特征空间的维数大及训练数据容量大时尤其必要。

k近邻法最简单的实现是线性扫描（穷举搜索），即要计算输入实例与每一个训练实例的距离。计算并存储好以后，再查找K近邻。当训练集很大时，计算非常耗时。

为了提高kNN搜索的效率，可以考虑使用特殊的结构存储训练数据，以减小计算距离的次数。

k值选择问题。¹

kd树

如果A和B距离很远，B和C距离很近，那么A和C的距离也很远。

原理

![在这里插入图片描述](https://img-blog.csdnimg.cn/20201106093602311.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl8zODg3MTk4OA==,size_16,color_FFFFFF,t_70#pic_center
构造方法
（1）构造根结点，使根结点对应于K维空间中包含所有实例点的超矩形区域；

（2）通过递归的方法，不断地对k维空间进行切分，生成子结点

（3）上述过程直到子区域内没有实例时终止（终止时的结点为叶结点）。

。。。

最近邻域搜索（Nearest-Neighbor Lookup）

kd树(K-dimension tree)是一种对k维空间中的实例点进行存储以便对其进行快速检索的树形数据结构。kd树是一种二叉树，表示对k维空间的一个划分，构造kd树相当于不断地用垂直于坐标轴的超平面将K维空间切分，构成一系列的K维超矩形区域。kd树的每个结点对应于一个k维超矩形区域。利用kd树可以省去对大部分数据点的搜索，从而减少搜索的计算量。

最低0.47元/天解锁文章

weixin_38871988

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
机器学习算法之二KD树

KD树实现k近邻算法时，主要考虑的问题是如何对训练数据进行快速k近邻搜索。这在特征空间的维数大及训练数据容量大时尤其必要。k近邻法最简单的实现是线性扫描（穷举搜索），即要计算输入实例与每一个训练实例的距离。计算并存储好以后，再查找K近邻。当训练集很大时，计算非常耗时。为了提高kNN搜索的效率，可以考虑使用特殊的结构存储训练数据，以减小计算距离的次数。k值选择问题。1kd树如果A和B距离很远，B和C距离很近，那么A和C的距离也很远。原理![在这里插入图片描述](https://img-blo
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。