K近邻法

最新推荐文章于 2021-06-21 17:29:03 发布

预知梦_

最新推荐文章于 2021-06-21 17:29:03 发布

阅读量283

点赞数

分类专栏：机器学习知识回顾文章标签： k近邻算法机器学习算法机器学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/im_chenxi/article/details/80273223

版权

机器学习知识回顾专栏收录该内容

12 篇文章 0 订阅

订阅专栏

k近邻法是一种基本分类与回归方法。

k紧邻法的三个基本要素：k值的选择、距离度量、分类决策规则。

一、k近邻算法

输入：训练数据集T，要预测的特征向量x。

输出：特征向量x对应实例的类别y。

步骤：1.根据给定的距离度量，在训练集T中找出与x最近邻的k个点。

2.依据找出的k个点，根据决策规则决定x的类别y。

对分类模型，一般是对k个点进行投票，选择最多的类别。对于回归模型，取k个点对应y的平均值。

二、k近邻模型

1.距离度量：特征空间中两个实例点的距离是两个实例点的相似程度的反映，一般使用欧氏距离。

$L_p$ 距离定义： $L_p(x_i,x_j)=(\sum_{l=1}^{n}|x_{(l)}^{i}-x_{(l)}^{j}|^{p})^{\frac{1}{p}}$

p=2,称为欧氏距离，p=1称为曼哈顿距离，p= $\propto$ 时，它是各个坐标距离的最大值。

2.k值得选择

k值选择较小：学习的估计误差会增大，预测结果会对实例点十分敏感，模型变得复杂，容易发生过拟合

k值选择较大：学习的近似误差会增大，与预测实例较远的点也会起预测作用，模型变得简单。

一般k选择一个比较小的值，采用交叉验证来选取最优。

3.分类决策规则

分类：一般是多数表决，等价于经验风险最小化。

回归：取平均值。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
K近邻法

k近邻法是一种基本分类与回归方法。 k紧邻法的三个基本要素：k值的选择、距离度量、分类决策规则。一、k近邻算法输入：训练数据集T，要预测的特征向量x。输出：特征向量x对应实例的类别y。步骤：1.根据给定的距离度量，在训练集T中找出与x最近邻的k个点。 2.依据找出的k个点，根据决策规则决定x的类别y。 ...
复制链接

扫一扫

专栏目录

预知梦_ CSDN认证博客专家 CSDN认证企业博客

码龄7年

32: 原创

20万+: 周排名

200万+: 总排名

11万+: 访问

: 等级

1215: 积分

9: 粉丝

44: 获赞

17: 评论

126: 收藏

私信

关注

热门文章

分类专栏

最新评论

TensorFlow指定GPU设备、分配显存
Tisfy: 我曾经流连于宋元的词曲，但刚发现此文甚妙！
利用TensorFlow构建神经网络的一般步骤及常用方法和函数
weixin_46313564: 年轻人不讲武德！！！你讲的也太好了，很多我见过，却没有留意深思的东西都在你这里见到了。完美的概括了写一个完整代码的全部过程！！！如果满分是100分的话，我给你82分，再给你666！！！多谢多谢！！！
C/C++enum枚举类型及赋值范围
Alie_zzZ: undefined
C/C++enum枚举类型及赋值范围
cheersTheDay: 我看的也是这本书，我用的是linux系统，如果枚举最大值不超过INT_MAX，那么枚举最大范围是int的最大值超出就会溢出；第10章有简单说了这个问题 c++11扩展了枚举，然后默认枚举底层类型就是int，可以定义枚举时设置 enum enumName :short 来改变底层类型
C/C++enum枚举类型及赋值范围
Crayon! 回复浮生26733: 我测试下来默认是21亿

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。