统计学习方法 pdf_李航统计学习方法（第三章）

最新推荐文章于 2024-08-08 13:47:59 发布

weixin_39917046

最新推荐文章于 2024-08-08 13:47:59 发布

阅读量2.4k

点赞数

文章标签：统计学习方法 pdf

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39917046/article/details/111393022

版权

本文详细介绍了k近邻(k-NN)算法，包括使用不同的距离度量如切比雪夫距离、曼哈顿距离和欧几里得距离，k值选择的影响，以及如何通过kd树优化搜索效率。k-NN的决策规则是多数表决，而kd树的构建和搜索策略能有效减少计算距离的次数。

摘要由CSDN通过智能技术生成

第3章 k 近邻法

k 近邻法（k-NN）是一种基于实例的学习方法，无法转化为对参数空间的搜索问题（参数最优化问题）。它的特点是对特征空间进行搜索。除了k近邻法，本章还对以下几个问题进行较深入的讨论：

切比雪夫距离
的计算
“近似误差”与“估计误差”的含义
k-d树搜索算法图解

一、算法

输入：训练集

，

为实例特征向量，

为实例的类别，

输出：实例

所属的类

设在给定距离度量下，涵盖最近k个点的邻域为

。

其中示性函数

寻找使得函数

取得最大值的变量

，也就是说，看看距离

最近的k个点里面哪一类别最多，以此作为输出。关于

的含义可参考本专栏的第一章。

mygame182：李航统计学习方法（第一章）zhuanlan.zhihu.com

二、模型

根据模型的分类，k-NN模型属于非概率模型。

观察

可发现它与感知机不同的之处，作为决策函数，它并不需要任何未知参数（感知机需要确定w和b），直接从训练集的数据得到输出。

距离度量

k-NN的基本思想是，特征空间中的距离反映了两个点的相似程度，因此“距离”是作出分类判断的基本依据。向量空间

的距离有多种度量方式：

（1）不同距离度量

一般形式是闵可夫斯基距离（

范数）：

当p=1时，称为曼哈顿距离（

范数）：

当p=2时，称

最低0.47元/天解锁文章

weixin_39917046

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。