K-D tree详解

K-D tree大意:建立在暴力平衡树替罪羊树上的一种暴力数据分割方式

而且在某些问题上拥有玄学的时间复杂度,感觉很废
也可以去看看ball tree,比这个优秀(但是麻烦


前置芝士:替罪羊树

自己找资料学吧,懒得写


时间复杂度:

不好说啊,视题目而定吧
对于k维数据,像查询一些区间内的点和第几远就是 O ( n l o g n ) 到 O ( n ⋅ n 1 − 1 k ) O(nlogn)到O(n\cdot n^{1-\frac {1}{k}}) O(nlogn)O(nn1k1)的(不会证明
但是对于找近邻感觉完全没法分析(玄学
听说BBF可以优化?


算法:

给你一堆点,每个点有k个坐标(k维直角坐标系)
已经说了是暴力数据分割了,你应该知道怎么做吧

存储信息:

每个点存一下自己的左右儿子,子树大小(重建需要),子树中每一位坐标最大和最小(判断区域)即可
有时要顺应题目要求存一些点权和或最大、小值之类

插入:

总体来讲就是像平衡树设置一个根,然后一个一个元素插入,每次只增加一个节点;
但我们判断新建点进左子树还是进右子树的策略改变,因为我们有多个判断指标,是多维而不是普通平衡树的一维,所以我们要采取特殊的分割方式:

第一,很容易想到的是轮换分割
每个坐标轮流着来,众生平等,让每个坐标都尽量平均。
example:这一层用x分割,下一层用y分割,再下一层用x分割

第二,有点神奇的方差分割
可以参考:方差
但是这玩意很少用,也没什么人专门卡K-D tree
而且用起来需要大量的加法和乘法,而它们都是很慢的,常数大,有时还没有轮换快

我们这里所说的分割,实际上是通过当前点x的坐标与新建点y的坐标相比来确定进入哪一棵子树
如果现在的坐标判断是wd,d存储坐标,则:

  • 若y.d[wd]<=x.d[wd],进入左子树
  • 若y.d[wd]>x.d[wd],进入右子树

当我们无路可走,即当前点标号为0(即没有建过)时,就可以新建点在这里安家了

查询:

就是暴力,每到一个点就用当前点信息更新答案,注意是当前点而不是区间。

然后就是尽量剪枝
感觉每个题剪枝都不太一样啊
但是很明确的有几种

  1. 查询某块区域的点,直接通过判断坐标来得出区域相交信息来剪枝
    如果查询的区间包括当前点表示的区间,直接加上当前区间的总答案
    如果有交集但不包括,就左右子树都进入查询(可见其暴力
    如果没有交集,直接回溯

  2. 查询k远离,维护一个小根堆,每次比较一下当前的区间中的最远距离和堆顶
    如果最远距大于堆顶,就左右子树爆搜
    如果不,直接回溯

  3. 查询k近邻,感觉就是假的,每次比较左右子树的最小值,同时像上面比较最近距离和堆顶
    左子树小就先走左子树,右儿子小就先走右子树,什么玩意


技巧:

先给你n个点的时候可以不一个一个插入(很慢)
直接一发重建函数把树建出来:

rt=build(1,n,0);

代码:

代码中可以看到一个函数:nth_element
其实没什么高级的,就是将l~r的指定位置mid搞一搞,前面的数小于a[mid],后面的数大于a[mid]
因为有多维所以要写一个重载运算符或一个cmp函数

#include<bits/stdc++.h>
using namespace std;
const double alpha=0.7;
const int k=2;
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
K-D Tree(K-Dimensional Tree)算法是一种基于分治法的数据结构,用于高维空间的搜索和排序。它的基本思想是将多维空间中的点以某种方式分割成更小的子空间,然后在每个子空间中递归地进行搜索。这样可以大大降低搜索的复杂度。 具体来说,K-D Tree算法可以分为以下几步: 1. 选择一个维度,将数据点按照该维度的值进行排序。 2. 找到该维度的中位数,将其作为当前节点,并将数据点分为左右两个子集。 3. 递归地构建左子和右子,每次选择一个新的维度进行划分。 4. 最终得到一个K-D Tree。 在搜索时,我们可以从根节点开始,按照一定的规则向下遍历,直到找到目标点或者无法继续向下搜索。具体的规则是: 1. 如果目标点在当前节点的左子中,则继续向左子搜索。 2. 如果目标点在当前节点的右子中,则继续向右子搜索。 3. 如果目标点和当前节点在选定的维度上的值相等,则说明已经找到目标点。 分治法是一种常见的算法思想,它将一个大规模的问题分解成若干个小规模的子问题,每个子问题独立地求解,然后将这些子问题的解合并起来得到原问题的解。分治法通常包含三个步骤:分解、求解、合并。 具体来说,分治法可以分为以下几步: 1. 分解:将原问题分成若干个子问题,每个子问题规模较小且结构与原问题相同。 2. 求解:递归地求解每个子问题,直到问题规模足够小可以直接求解。 3. 合并:将所有子问题的解合并成原问题的解。 分治法的优点是可以有效地降低算法的时间复杂度。但是它的缺点是需要额外的空间来存储子问题的解,而且分解和合并的过程也需要耗费一定的时间。因此,需要根据实际情况选择合适的算法。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值