统计学习方法-第3章-k近邻法

最新推荐文章于 2022-11-06 00:27:56 发布

chiemon

最新推荐文章于 2022-11-06 00:27:56 发布

阅读量185

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ahxieqi/article/details/94918381

版权

2019 June 30 k近邻法

统计学习方法-第3章-k近邻法

k近邻法

分类与回归方法
多数表决、无显示的学习过程
三个基本要素：k值的选择、距离度量、分类决策规则

模型

k 近邻法的模型对应特征空间的一个划分。

距离度量

特征空间中的两个实例点的距离是两个实例点相似程度的反映。距离越近(数值越小)，相似度越大。

$L_p$ 距离：

p = 1，曼哈顿距离
p = 2，欧式距离
p = ∞

k 值的选择

k 值的选择反应了对近似误差与估计误差之间的权衡；
k 值减小，整体模型变得复杂，易发生过拟合；
k 值增大，整体模型变得简单；

在应用中，k 值一般取一个比较小的数值。通常采用交叉验证法来选取最优的 k 值。

分类决策规则

多数表决规则，对应于经验风险最小化。

损失函数：0-1 损失函数

分类函数：$f: \mathbf { R } ^ { n } \rightarrow \left{ c_1, c_2,\cdots,c_K \right}$

误分类的概率：$P \left( Y \neq f\left( X \right) \right) = 1 - P \left( Y = f\left( X \right) \right)$

给定实例 $x \in \mathcal {X}$，其最近邻的 k 个训练实例点构成集合 $N_k\left( x \right)$。如果涵盖 $N_k\left( x \right)$ 的区域的类别是 $c_j$，那么误分类率是

策略

无显示的学习过程

算法

输入：$T = \left{ \left( x _ { 1 } , y _ { 1 } \right) , \left( x _ { 2 } , y _ { 2 } \right) , \cdots , \left( x _ { N } , y _ { N } \right) \right}$，$x _ { i } \in \mathcal { X } = \mathbf { R } ^ { n }$，$y _ { i } \in \mathcal { Y } = { c _ { 1 } , c _ { 2 }, \cdots ,c _ { k } }$，实例特征向量 $x$;

输出：实例所属的类 $y$

步骤：

根据指定的距离度量，在 $T$ 中查找 $x$ 的最近邻的 $k$ 个点，覆盖这 $k$ 个点的 $x$ 的邻域定义为 $N_k(x)$
在 $N_k(x)$ 中应用分类决策规则决定 $x$ 的类别 $y$

$I$ 为指示函数。

kd树

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
统计学习方法-第3章-k近邻法

2019 June 30 k近邻法统计学习方法-第3章-k近邻法 k近邻法分类与回归方法多数表决、无显示的学习过程三个基本要素：k值的选择、距离度量、分类决策规则模型 k 近邻法的模型对应特征空间的一个划分。距离度量特征空间中的两个实例点的距离是两个实例点相似程度的反映。距离越近(数值越小)，相似度越大。 $L_p$ 距离： L _ { p } \left( x _ { ...
复制链接

扫一扫

chiemon CSDN认证博客专家 CSDN认证企业博客

码龄7年

109: 原创

-: 周排名

174万+: 总排名

6万+: 访问

: 等级

510: 积分

9: 粉丝

5: 获赞

3: 评论

72: 收藏

私信

关注

热门文章

最新评论

tfrecord数据集制作及读取
果邪: RuntimeError: Input pipelines based on Queues are not supported when eager execution is enabled. Please use tf.data to ingest data into your model instead. 博主这是什么情况
DenseNet 笔记
is_sun1996: 请问channel-wise concatenation是什么运算，能举例说明吗？来自小白的问题。
DenseNet 笔记
理查德·帕克: 文章中的图片好像显示不出来了

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。