李航《统计学习方法》第三章课后习题
import numpy as np
def loadDataSet():
T=[[2,3],[5,4],[9,6],[4,7],[8,1],[7,2]] #书上数据加载一下
return np.mat(T)
def Kd_split(T):
T0_var=np.var(T[:,0]) #选择x轴为坐标轴并算方差
T1_var=np.var(T[:,1]) #选择y轴为坐标轴并算方差
Tmax=max(T0_var,T1_var) #看哪个轴上的方差大,取方差大的轴
left_node=[]
right_node=[]
if Tmax==T0_var: #如果x轴方差大
X0_sorted=T[np.lexsort(T[:,::-1].T)] #按x轴排个序先(这里就是按第一列从小到大排序)
Kd_split(X0_sorted[0,:int(len(T)/2)]) #把从小一直到中值的数继续算方差、选轴、排序
left_node.append(X0_sorted[0,int(len(T)/2)+1].T)#取中值给左节点列表
Kd_split(X0_sorted[0,int(len(T) / 2):]) #把从中值一直到大的数算方差选轴排序
right_node.append(X0_sorted[0,int(len(T)/2)].T) #取中值给右节点列表
else:
X1_sorted = T[np.lexsort(T.T)] #如果y轴方差大
left_node.append(X1_sorted[0][:int(len(T) / 2)]) #取从小到中值的数给左节点
right_node.append(X1_sorted[0][int(len(T) / 2):])#取从中值到大的数给右节点
print('left_node',left_node) #打印左右节点列表
print('right_node:',right_node)
T=loadDataSet()
Kd_split(T)
参考https://blog.csdn.net/zuanfengxiao/article/details/79064006