K-D tree详解

K-D树是一种基于暴力平衡树的多维数据结构,常用于高维空间的数据分割。它在某些问题上表现出复杂的时空复杂度,如查询区间内的点和第k远的点。K-D树的插入和查询操作涉及到特殊的轴旋转和坐标比较。虽然在二维和三维空间有较好的表现,但在更高维空间可能会变得低效。文章提到了方差分割策略和轮换分割策略,并提供了重建函数快速构建K-D树的方法。此外,文章还讨论了K-D树在查询最近邻、最远邻和矩形区域内点的问题,以及如何利用堆进行优化。
摘要由CSDN通过智能技术生成

K-D tree大意:建立在暴力平衡树替罪羊树上的一种暴力数据分割方式

而且在某些问题上拥有玄学的时间复杂度,感觉很废
也可以去看看ball tree,比这个优秀(但是麻烦


前置芝士:替罪羊树

自己找资料学吧,懒得写


时间复杂度:

不好说啊,视题目而定吧
对于k维数据,像查询一些区间内的点和第几远就是 O ( n l o g n ) 到 O ( n ⋅ n 1 − 1 k ) O(nlogn)到O(n\cdot n^{1-\frac {1}{k}}) O(nlogn)O(nn1k1)的(不会证明
但是对于找近邻感觉完全没法分析(玄学
听说BBF可以优化?


算法:

给你一堆点,每个点有k个坐标(k维直角坐标系)
已经说了是暴力数据分割了,你应该知道怎么做吧

存储信息:

每个点存一下自己的左右儿子,子树大小(重建需要),子树中每一位坐标最大和最小(判断区域)即可
有时要顺应题目要求存一些点权和或最大、小值之类

插入:

总体来讲就是像平衡树设置一个根,然后一个一个元素插入,每次只增加一个节点;
但我们判断新建点进左子树还是进右子树的策略改变,因为我们有多个判断指标,是多维而不是普通平衡树的一维,所以我们要采取特殊的分割方式:

第一,很容易想到的是轮换分割
每个坐标轮流着来,众生平等,让每个坐标都尽量平均。
example:这一层用x分割,下一层用y分割,再下一层用x分割

第二,有点神奇的方差分割
可以参考:方差
但是这玩意很少用,也没什么人专门卡K-D tree
而且用起来需要大量的加法和乘法,而它们都是很慢的,常数大,有时还没有轮换快

我们这里所说的分割,实际上是通过当前点x的坐标与新建点y的坐标相比来确定进入哪一棵子树
如果现在的坐标判断是wd,d存储坐标,则:

  • 若y.d[wd]<=x.d[wd],进入左子树
  • 若y.d[wd]>x.d[wd],进入右子树

当我们无路可走,即当前点标号为0(即没有建过)时,就可以新建点在这里安家了

查询:

就是暴力,每到一个点就用当前点信息更新答案,注意是当前点而不是区间。

然后就是尽量剪枝
感觉每个题剪枝都不太一样啊
但是很明确的有几种

  1. 查询某块区域的点,直接通过判断坐标来得出区域相交信息来剪枝
    如果查询的区间包括当前点表示的区间,直接加上当前区间的总答案
    如果有交集但不包括,就左右子树都进入查询(可见其暴力
    如果没有交集,直接回溯

  2. 查询k远离,维护一个小根堆,每次比较一下当前的区间中的最远距离和堆顶
    如果最远距大于堆顶,就左右子树爆搜
    如果不,直接回溯

  3. 查询k近邻,感觉就是假的,每次比较左右子树的最小值,同时像上面比较最近距离和堆顶
    左子树小就先走左子树,右儿子小就先走右子树,什么玩意


技巧:

先给你n个点的时候可以不一个一个插入(很慢)
直接一发重建函数把树建出来:

rt=build(1,n,0);

代码:

代码中可以看到一个函数:nth_element
其实没什么高级的,就是将l~r的指定位置mid搞一搞,前面的数小于a[mid],后面的数大于a[mid]
因为有多维所以要写一个重载运算符或一个cmp函数

#include<bits/stdc++.h>
using namespace std;
const double alpha=0.7;
const int k=2;
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值