K近邻算法

xuhss_com

于 2022-03-03 12:41:19 发布

阅读量895

点赞数

分类专栏：计算机文章标签： django python 后端

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xuhss_com/article/details/123251045

版权

本文详细介绍了K近邻算法的基本概念、工作原理以及影响其性能的关键因素，包括k值选择、特征数据归一化、邻居距离度量和分类原则。通过Python微信订餐小程序和量化交易理财系统的实战课程，结合红酒数据集展示了KNN算法在实际问题中的应用。

摘要由CSDN通过智能技术生成

Python微信订餐小程序课程视频

https://edu.csdn.net/course/detail/36074

Python实战量化交易理财系统

https://edu.csdn.net/course/detail/35475
一、K近邻算法简介

K近邻算法(K-Nearest Neighbor)简称KNN算法,是最简单的预测模型之一，它没有多少数学上的假设，也不要求任何复杂的处理，它所要求的只有以下两点

1.某种距离计算概念

2.彼此接近的点具有相似的性质

即对于一个新样本，算法在已有数据中寻找与它最相似的K个数据，或者说“离它最近”的K个数据，如果这K个数据大多数属于某个类别，则该样本也属于这个类别。

KNN算法只依赖待预测节点附近的少量节点，有意的忽略了数据集中的大量样本，同时该算法也不能帮助我们理解事物现象背后的机制和原理；

预测策略通常采用多数表决的投票法；也就是将k个样本中出现最多的分类作为预测结果；计算公式如下，里边的v是样本的分类标签，yi是第i个样本的分类标签，I是指示函数，如果预测结果属于某个分类就返回1，否则返回0，则最终取出现次数最多的分类作为预测结果；

y=argmaxv∑(xi,yi)∈DzI(v=yi)y = argmax_{v} \sum_{(x_{i},y_{i})\in D_{z}} I(v=y_{i})
相对来说，K近邻学习

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。