Kdtree
Kdtree是一种划分k维数据空间的数据结构,本质也是一颗二叉树,只不过每个节点的数据都是k维,当k=1时,就是普通二叉树。
建立Kdtree实际上是一个不断划分的过程,首先选择最sparse的维度(一般通过计算数据在各个维度的方差,选择方差大的作为本次分割维度),然后找到该维度上的中间点,垂直该维度做第一次划分。此时k维超平面被一分为二,在两个子平面中再找最sparse的维度,以此类推直到最后一个点也被划分,那么就形了一个不断二分的树。
二维Kdtree的建立过程下图所示,首先分别计算x,y方向上数据的方差,得知x方向上的方差最大,所以split域值首先x轴方向;然后根据x轴方向的值2,5,9,4,8,7排序选出中值为7,所以Node-data = (7,2)。这样,该节点的分割超平面就是通过(7,2)并垂直于split = 0(x轴)的直线x = 7,后面以此类推。