knn聚类还是分类_KNN 和K-means

KNN是一种分类算法,依赖于最近邻的类别进行预测,K值选择对结果有很大影响。K-means是聚类算法,通过迭代优化找到最佳聚类中心,K值可以通过手肘法和轮廓系数法来确定。KNN中的K值过小易受噪声影响,过大则增加近似误差;K-means中合适的K值能提供更好的聚类效果。
摘要由CSDN通过智能技术生成

一、KNN

  KNN是一种分类算法,它不具有显式的学习过程。对应的输入是特征空间的点,输出为实例的类别,可以是多类别。

1.算法思路

  如果一个样本在特征空间中的k个最邻近的样本中的大多数属于某一个类别,则该样本也划分为这个类别。KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。

举例说明如下:

  我们要确定绿点属于哪个颜色(红色或者蓝色),要做的就是选出距离目标点距离最近的k个点,看这k个点的大多数颜色是什么颜色。当k取3的时候,我们可以看出距离最近的三个,分别是红色、红色、蓝色,因此得到目标点为红色。

9ccab216a9c2559995cc4a1aa902df53.png

算法步骤:

  1)计算测试数据与各个训练数据之间的距离;

  2)按照距离的递增关系进行排序;

  3)选取距离最小的K个点;

  4)确定前K个点所在类别的出现频率;

  5)返回前K个点中出现频率最高的类别作为测试数据的预测分类

2.三个基本要素

  • k值的选择:k值的选择会对结果产生重大影响。较小的k值可以减少近似误差(训练集误差),但是会增加估
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值