k近邻算法_k最近邻分类算法(KNN)的原理及其实现

最新推荐文章于 2024-08-11 22:50:26 发布

weixin_39913628

最新推荐文章于 2024-08-11 22:50:26 发布

阅读量1.8k

点赞数

文章标签： k近邻算法手动实现多分类adaboost算法

k近邻算法（KNN）是一种基于实例的学习，通过计算待分类样本与训练集样本的距离，选取最近的K个样本，根据多数表决原则确定待分类样本的类别。本文详细介绍了KNN的算法思路、描述、步骤，探讨了K值选择、距离度量和分类决策规则，并给出了KNN在电影分类问题上的Python实现示例。

摘要由CSDN通过智能技术生成

1. 算法思路

通过计算每个训练样例到待分类样品的距离，取和待分类样品距离最近的K个训练样例，K个样品中哪个类别的训练样例占多数，则待分类样品就属于哪个类别

核心思想：如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别，则该样本也属于这个类别，并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。kNN方法在类别决策时，只与极少量的相邻样本有关。由于kNN方法主要靠周围有限的邻近的样本，而不是靠判别类域的方法来确定所属类别的，因此对于类域的交叉或重叠较多的待分样本集来说，kNN方法较其他方法更为适合。

2. 算法描述

算距离：给定测试对象，计它与训练集中的每个对象的距离

依公式计算 Item 与 D1、D2 … …、Dj 之相似度。得到Sim(Item, D1)、Sim(Item, D2)… …、Sim(Item, Dj)。

将Sim(Item, D1)、Sim(Item, D2)… …、Sim(Item, Dj)排序，若是超过相似度阈值t则放入邻居案例集合NN。

找邻居：圈定距离最近的k个训练对象，作为测试对象的近邻

自邻居案例集合NN中取出前k名，依多数决，得到Item可能类别。

做分类：根据这k个近邻归属的主要类别，来对测试对象分类

最低0.47元/天解锁文章

weixin_39913628

关注

0
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。