K-D tree大意:建立在暴力平衡树替罪羊树上的一种暴力数据分割方式
而且在某些问题上拥有玄学的时间复杂度,感觉很废
也可以去看看ball tree,比这个优秀(但是麻烦
前置芝士:替罪羊树
自己找资料学吧,懒得写
时间复杂度:
不好说啊,视题目而定吧
对于k维数据,像查询一些区间内的点和第几远就是 O ( n l o g n ) 到 O ( n ⋅ n 1 − 1 k ) O(nlogn)到O(n\cdot n^{1-\frac {1}{k}}) O(nlogn)到O(n⋅n1−k1)的(不会证明
但是对于找近邻感觉完全没法分析(玄学
听说BBF可以优化?
算法:
给你一堆点,每个点有k个坐标(k维直角坐标系)
已经说了是暴力数据分割了,你应该知道怎么做吧
存储信息:
每个点存一下自己的左右儿子,子树大小(重建需要),子树中每一位坐标最大和最小(判断区域)即可
有时要顺应题目要求存一些点权和或最大、小值之类
插入:
总体来讲就是像平衡树设置一个根,然后一个一个元素插入,每次只增加一个节点;
但我们判断新建点进左子树还是进右子树的策略改变,因为我们有多个判断指标,是多维而不是普通平衡树的一维,所以我们要采取特殊的分割方式:
第一,很容易想到的是轮换分割:
每个坐标轮流着来,众生平等,让每个坐标都尽量平均。
example:这一层用x分割,下一层用y分割,再下一层用x分割
第二,有点神奇的方差分割:
可以参考:方差
但是这玩意很少用,也没什么人专门卡K-D tree
而且用起来需要大量的加法和乘法,而它们都是很慢的,常数大,有时还没有轮换快
我们这里所说的分割,实际上是通过当前点x的坐标与新建点y的坐标相比来确定进入哪一棵子树
如果现在的坐标判断是wd,d存储坐标,则:
- 若y.d[wd]<=x.d[wd],进入左子树
- 若y.d[wd]>x.d[wd],进入右子树
当我们无路可走,即当前点标号为0(即没有建过)时,就可以新建点在这里安家了
查询:
就是暴力,每到一个点就用当前点信息更新答案,注意是当前点而不是区间。
然后就是尽量剪枝
感觉每个题剪枝都不太一样啊
但是很明确的有几种
-
查询某块区域的点,直接通过判断坐标来得出区域相交信息来剪枝
如果查询的区间包括当前点表示的区间,直接加上当前区间的总答案
如果有交集但不包括,就左右子树都进入查询(可见其暴力
如果没有交集,直接回溯 -
查询k远离,维护一个小根堆,每次比较一下当前的区间中的最远距离和堆顶
如果最远距大于堆顶,就左右子树爆搜
如果不,直接回溯 -
查询k近邻,
感觉就是假的,每次比较左右子树的最小值,同时像上面比较最近距离和堆顶
左子树小就先走左子树,右儿子小就先走右子树,什么玩意
技巧:
先给你n个点的时候可以不一个一个插入(很慢)
直接一发重建函数把树建出来:
rt=build(1,n,0);
代码:
代码中可以看到一个函数:nth_element
其实没什么高级的,就是将l~r的指定位置mid搞一搞,前面的数小于a[mid],后面的数大于a[mid]
因为有多维所以要写一个重载运算符或一个cmp函数
#include<bits/stdc++.h>
using namespace std;
const double alpha=0.7;
const int k=2;