KNN和Kmeans

KNNKmeans


KNN的主要思想knn主要用于给一个新的数据打标签。假设已知样本都有一个labellabelk个总类。对于新样本,计算其到其他所有样本的欧式距离,并对这些距离进行排序。选择距离最小的前k个样本,取这些样本中频率最高的label作为新样本的label

KNN的特点:没有显示的学习过程

Kmeans的主要思想kmeans属于聚类,将没有标签的样本聚成k个类。初始状态下,任意选择k个点作为k个聚类的中心,对k个点中的每个点,计算到其距离最近的k个点,计算这k个点的中心,作为当前聚类的新的中心。针对k个新的聚类中心重复以上的操作。

Kmeans的特点:体现了EM算法的思想。

Kmeans的缺陷:聚类中心的个数K需要事先人为给出,不同的初始聚类中心可能导致完全不同的聚类结果。

KNNKmeans的区别KNN是有标签的,属于分类问题;Kmeans是无标签的,属于聚类问题。

KNN

K-Means

1.KNN是聚类算法

2.监督学习(有标签)

1.K-Means是聚类算法

2.非监督学习(无标签)

没有显示的学习过程

有明显的前期训练过程


来了一个样本x,要给它分类,即求出它的y,就从数据集中,在x附近找离它最近的K个数据点,这K个数据点,类别c占的个数最多,就把xlabel设为c

初始状态下,任意选择k个点作为k个聚类的中心,对k个点中的每个点,计算到其距离最近的k个点,计算这k个点的中心,作为当前聚类的新的中心。针对k个新的聚类中心重复以上的操作。

相似点:都包含这样的过程,给定一个点,在数据集中找离它最近的点。即二者都用到了NN(NearsNeighbor)算法,一般用KD树来实现NN


还有许多的细节要补充,比如EM与Kmeans之间的关系等等,慢慢补充。

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值