KD树
kd树其实就是多维二叉树(空间二叉树的一种特殊情况), 里面储存着k维的点的信息,是对k维空间进行划分的一种数据结构。
KD树可以解决以下几个任务:
- KNN问题。即查询离某个点第k邻近的点
- 查询最近最远(就是 KNN问题)
- 查询矩阵和
- 图像处理
KD树的构建
KD树是一种平衡二叉树,它的各种操作都与我们学过的数据结构方法相似,KD树的构建有两种方法:一种利用方差,一种根据维度来划分。我们通常采用后者,因为后者更方便,也更好理解。
具体操作:
对于一个k维的超平面(维度>3想象不出来,就叫超平面),在KD树每一层的构建中都选择一个维度来进行划分,将k维的数据空间分为两部分,并使其尽量平衡。然后如此递归下去。
也就是说假如我们要储存n个三维的点(x,y,z)信息。我们先按x坐标sort一遍,选出中间值x{mid}作为根节点,然后所有x比 x_{mid}小的点在左子树,比 x_{mid}大的在右子树。
然后左,右子树分别按照y坐标sort一遍选出中间值作为子树的根节点,接着再在子树中按照z坐标sort一遍。接着再按x坐标…以此类推。
sort顺序即为:x->y->z->x->y->z->x…
这里举个例子: 将(4,7),(9,6),(8,1),(2,3),(5,4),(7,2),构造成一颗KD树。
在KD树构中经常使用的搜索算法是最近邻算法。