ESL学习之kNN

在利用kNN进行分类时,我们是选择一个点的k个最近的neighbor的一些属性来估计当前点的属性。

kNN的一个局限性就在于当参数空间的维数p增大后,这k个neighbor更趋近于分布在离当前点较远的那部分。意思就是在一个半径为1的p维球体中,若存在k个点,那么这k个点更趋近于这个球体的边缘,这是为什么呢。

作为一个大概的理解,考虑在半径为0.5的地方,那么0.5半径以内的球体体积为exp(0.5,p),由于整体球体体积为1,故0.5半径内所占整体球体的体积会随着p的增大而逐渐趋向于0,所以这k个点更趋向于分布在0.5以及更远的地方。

下面是具体的数学表达。


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
《统计学习基础》是斯坦福大学教授Trevor Hastie、Robert Tibshirani和Jerome Friedman合著的一本经典教材,是统计学习领域的权威之作。该书系统地介绍了统计学习的基本概念、原理和方法,并提供了丰富的实例和练习题,可作为统计学习入门者的参考教材。 这本书主要包含了监督学习、非监督学习和半监督学习三个方面的内容。在监督学习部分,介绍了线性回归、逻辑回归、支持向量机等经典方法,以及决策树、随机森林和提升方法等集成学习方法。在非监督学习部分,详细讨论了聚类分析、主成分分析、混合模型等方法。在半监督学习部分,介绍了利用有标签数据和无标签数据相结合的方法。 《统计学习基础》着重于理论和实践相结合,每个方法都有相关的数学推导和算法描述,并以实例和图表的形式直观展示。同时,书中也介绍了一些统计学习中的常用工具和技巧,如交叉验证、正则化、特征选择等,以帮助读者更好地理解和应用统计学习方法。 对于统计学习入门者而言,读完《统计学习基础》可以获得对统计学习的整体认识和基本掌握。然而,由于书中内容深入且繁杂,需要读者具备一定的数学和统计基础才能更好地理解和应用其中的方法。因此,建议读者在阅读该书之前,先对数学和统计学的基本理论有所了解,以更好地理解书中内容,同时辅以相关实例和练习题的训练,实践掌握统计学习的方法和技巧。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值