李航 统计学习方法 例3.2 构造平衡kd数

这段代码展示了如何根据方差构建平衡的kd树。它首先定义了KdNode类来存储节点信息,然后在KdTree类中通过递归方式创建kd树,选取方差最大的维度作为分割依据。最后,提供了前序遍历kd树的方法。这个实现相较于原始的按坐标轴轮换选取维度的方式,更符合统计学习中的理论要求。
摘要由CSDN通过智能技术生成
# weihuizi 
import operator
import numpy as np

# kd-tree每个结点中主要包含的数据结构如下
class KdNode(object):
    def __init__(self, dom_elt, split, left, right):
        self.dom_elt = dom_elt  # k维向量节点(k维空间中的一个样本点)
        self.split = split      # 整数(进行分割维度的序号)
        self.left = left        # 该结点分割超平面左子空间构成的kd-tree
        self.right = right      # 该结点分割超平面右子空间构成的kd-tree


class KdTree(object):
    def __init__(self, data):

        def CreateNode(split, data_set):  # 按第split维划分数据集exset创建KdNode
            if not data_set:              # 数据集为空
                return None
            # key参数的值为一个函数,此函数只有一个参数且返回一个值用来进行比较
            # operator模块提供的itemgetter函数用于获取对象的哪些维的数据,参数为需要获取的数据在对象中的序号
            data_set.sort(key=operator.itemgetter(split)) # 按要进行分割的那一维数据排序  从小到大排序
            #data_set.sort(key=lambda x: x[split])
            split_pos = len(data_set)
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值