KdTree理解与实现(Java)
抛出问题
如果让你设计一个外卖系统,你的数据库中有所有外卖商家所在的经纬度,那么如何能有效地根据用户的位置筛选出所有附近的商家?
最直接的方法是根据城市或者城市的每个区(如崂山区,市南区…)来对商家进行分类,然后根据用户所在的区返回同一区域下的所有商家。这个方法可以解决大部分问题,但是如果用户位于两个区的分界线周围怎么办?
KdTree简介
KdTree 是以二叉搜索树(Binary Search Tree)为原型的用于空间检索的数据结构,能够在随机分布的空间内以 O(log2N) 的时间复杂度实现对平面内点的搜索以及 O(log2N) + R 的复杂度查询平面内任意矩形内的所有点(R为矩形内点的个数)。 KdTree的应用十分广泛,包括且不限于范围搜索,最邻近点搜索,物理引擎中的碰撞检测以及地理节点(如外卖商家)数据库等。
原理简介
KdTree的实现方法与BST十分相似,以最常用的二维平面的KdTree为例,其每个节点存储一个二维的坐标点,并将平面空间以该点所在的横线/竖线递归地分割成两个子空间。
以width = 1.0, height = 1.0的单位平面为例,依次插入下列点
Note:
- 点对平面的分割方式是横向/纵向按照层次交替出现(根节点是哪个方向都可以)。
- 插入节点的方法类似于BST,即从根节点开始,(设要插入的节点为Pinsert,当前遍历的节点为Pcurrent)如果Pinsert在Pcurrent的左边或者下边,那么就访问Pcurrent的left child, 反之访问right child直到成为叶子节点。
- 本KdTree不支持删除操作。
代码实现
在介绍KdTree实现之前先定义两个辅助类Point(用来表示点)和Rect(用来表示矩形)
Point.java
用来表示一个坐标点,在本博客的语境下只需要两个方法:计算与另一点的距离(以平方和的形式) 和 判断两点是否相等。
// @file Point.java
// @author 王成昊
// @date 2018.10.14
public class Point {
public final double x;
public final double y;
// Point类是 immutable datatype
public Point(double x, double y) {
this.x = x;
this.y = y;
}
// 为了减少计算量,一般使用平方和来表示距离
public double distanceSquareTo(Point that) {
double dx = that.x - this.x;
double dy = that.y - this.y;
return dx * dx + dy * dy;
}
@Override
public boolean equals(Object that) {
if (this == that) return true;
if (that == null) return false;
if (that.getClass() != this.getClass()) return false;
Point point = (Point) that;
return (x == point.x) && (y == point.y);
}
}
Rect.java
用来表示一个矩形,在本例中使用四个坐标值来表示一个矩形。需要的方法是 判断矩形是否包含一个点 和 计算矩形和某点的距离(平方和的形式)
// @file Rect.java
// @author 王成昊
// @date 2018.10.14
public class Rect {
// 分别表示左下顶点和右上顶点
public final double minX;
public final double minY;
public final double maxX;