KNN与KD-tree

最新推荐文章于 2022-08-23 16:26:02 发布

abcabsd

最新推荐文章于 2022-08-23 16:26:02 发布

阅读量1.5k

点赞数

原文地址：http://blog.csdn.net/lanbing510/article/details/49926343

KNN最朴素的比较方法为轮询，改进方法kd-tree

写在前面

图像特征点匹配就是找到两幅图像中对应的特征点，在两幅图像中分别提取特征点并用描述子进行描述后，后面的问题就是如何找到一一对应的点对，也就是找到两组特征点集合中两两距离最近的特定点匹配对。在特征点输了不大的情况下（点集合大致小于2500对），进行简单的穷举搜索就可以，但当点对数量很大维度较高时，穷举的效率就回大大折扣，KD-Tree就是用来解决此种情形下的匹配问题。下面对KD-Tree的构建，KD-Tree的最近邻查询算法，改进的最近邻查询——BBF（Best Bin First）查询算法分别进行讨论。

KD-Tree的构建

KD-Tree是对数据点在k为空间划分的一种二叉树数据结构，每个节点表示的一个数据空间范围。它的构建过程是一个循环迭代的过程，假设数据的维度是D维，每次选择D维数据中方差最大的维度，以中间的数据进行划分（左子空间，右子空间），直到数据空间中只包含一个数据点。它的构建流程图如下：

下面结合一个简单的例子加深理解，假设我们有6个二维数据点： X,Y=(2,3),(5,4),(9,6),(4,7),(8,1),(7,2) ，我们首先计算两个维度上的方差 (39,26.83) 。可见x维度上的方差大，方差越大说明此维度越容易区分，所以第一步是以x为分割域进行分割。将6个数据按x维度排序，选取中值数据 (7,2) 作为第一个分裂点对数据进行划分（x维度小于7的划到左边，大于等于的划到右边），得到两个子空间，然后对子空间按照上述步骤进行迭代划分，直到每个数据都划到根节点（节点数据空间只含有一个数据点）。示意图如下：

改进的最近邻查询——BBF查询算法

从上述标准的KD-Tree最近邻查询过程可以看出，起搜索过程的回溯是由搜索路径来决定，并没有考虑查询路径上数据点本身的一些性质。改进的查询算法——BBF(Best Bin First)，通过将查询路径上的节点进行排序（如按各自分割超平面，也称Bin，与查询点的距离排序），优先回溯优先级最高（Best Bin）的节点来确保优先检索包含最近邻节点可能性更高的空间。BBF设置了一个运行超时限定，定优先级队列中的所有节点都经过检查或者超出时间限制时，算法返回目标找到的最好结果最为最近邻。下图是BBF整个算法流程：