机器学习之KNN算法

最新推荐文章于 2023-07-17 08:38:45 发布

刘不饱

最新推荐文章于 2023-07-17 08:38:45 发布

阅读量1k

点赞数

分类专栏：机器学习文章标签： k近邻机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_38997425/article/details/82956034

版权

机器学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

KNN，即k-近邻算法。

概念

k近邻是一种监督学习算法，其工作机制简单：给定测试样本，基于某种距离度量找出训练集中与其最靠近的k个训练样本，然后基于这k个“邻居”的信息来进行预测。

通常，分类任务中可使用“投票法”，即选择这k个样本中出现最多的类别标记作为预测结果，在回归任务中可使用“平均法”，即将这k个样本的实值输出标记的平均值作为预测结果，还可基于距离远近进行加权平均或加权投票，距离越近样本权重越大。

k近邻分类：一个样本在特征空间中，总会有k个最相似的样本。其中大多数的样本属于某个类别，则该样本也属于某个类别。

一般应用于客户流失预测、欺诈侦测，更适用于稀有事件的分类问题。

计算步骤

1.算距离：给定测试对象，计算它与训练集中每个对象的距离

2.找邻居：圈定距离最近的k个对象，作为测试对象的邻居

3.做分类：根据这k个对象的主要类别，来给测试对象分类

k-近邻是一种懒惰学习算法，考试才临阵磨枪，似乎没有显式的训练过程。

模型简单，计算开销大。

假设能够恰当的做出k个近邻，我们来对“最近邻分类器”(1NN,即k=1)在二分类问题上的性能做一个简单的讨论。

给定测试样本,若其最近邻样本为，则最近邻分类器出错的概率就是与类别标记不同的概率，即:

$P(err)=1-\sum_{c\epsilon y}P(c\mid x)P(c\mid z)$

最近邻分类器虽简单，但它的泛化错误率不超过贝叶斯最优分类器的错误率的两倍。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

博客等级

码龄7年

11
原创

61
点赞

236
收藏

20
粉丝

关注

私信

热门文章

分类专栏

最新评论

python连接MongoDB
qq_34621405: 博主，我用这样的方式连接，就提示未被授权？ pymongo.MongoClient(host=obj.base_inf['db_ip'], port=int(obj.base_inf['db_port']), username=obj.base_inf['username'], password=str(obj.base_inf['password']), authSource=obj.base_inf['database'])
python连接MongoDB
呆头呆脑~: PyMongo 4.0.* 中 Collection.insert 方法被移除，使用 Collection.insert_one 或者 Collection.insert_many 替代
python连接MongoDB
weixin_45366172: 不知道为什么会报错 TypeError: 'Collection' object is not callable. If you meant to call the 'authenticate' method on a 'Database' object it is failing because no such method exists.
python 使用pip 一键升级所有过期库
AdoShan: 我这升级到最新的2.3.1还是一样的报错
python 使用pip 一键升级所有过期库
刘不饱: 解决方法：paddlepaddle，paddlehub的安装版本为2.0.0，卸载，重装最新版本（2.1.1）

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。