关于《统计学习方法》中第三章构造kd树算法中的中位数问题

转载:https://blog.csdn.net/wzc_1230/article/details/88947740

最近在看李航所著的《统计学习方法》,很不错的一本书。但在第三章构造平衡kd树时,原书中说的是“以T中所有实例的x(1)坐标的中位数为切分点”(p42),此处的中位数说法自认为不准确。
根据随后给出的
例3.2 给定一个二维空间的数据集:
T={(2,3)T,(5,4)T,(9,6)T,(4,7)T,(8,1)T,(7,2)T}T={(2,3)T,(5,4)T,(9,6)T,(4,7)T,(8,1)T,(7,2)T},构建一个kd平衡树。

我们可以看到,若是取2,5,9,4,8,7的中位数应该是6,但却是根据(7,2)这个点来切分的,随后的递归过程中也是如此,此处让我很困惑。
于是上了维基百科查了一下,原来代码中的中位数的定义为```

median = len(point_list) // 2 # choose median
location=point_list[median]

即列表长度除以2向下取整,2,4,5,7,8,9长度为6,取point_list[3]作为median,由于python索引从0开始,point_list[3]为7,这也可以说明后边的递归过程中为什么选择(4,7)和(9,6)
自认为应将此处的“中位数”说法改成“中值”避免混淆。

  • 5
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值