聚类模型-原型聚类-KMeans

本文介绍了聚类模型中的KMeans算法,详细阐述了KMeans的类表示、失真函数定义以及算法流程,并对比了与模糊C均值聚类的区别。KMeans算法存在对初始值敏感、需要预设聚类数量等问题,适用于基于距离度量的聚类场景。
摘要由CSDN通过智能技术生成

聚类模型

1、层次聚类
2、原型聚类-K-means
3、模型聚类-GMM
4、EM算法-LDA主题模型
5、密度聚类-DBSCAN
6、图聚类-谱聚类

二、原型聚类-KMeans

​ KMeans的类表示是聚类中心点,以点 xi x i 来表示类,相似性度量同样可以采用常用的距离度量。根据类紧致性准则定义失真函数为所有样本点到该样本所在类中心的失真程度和最小。

J(c)=i=1m||x(i)c(i)j||2,i=1,2..m,j=1,2..k J ( c ) = ∑ i = 1 m | | x ( i ) − c j ( i ) | | 2 , i = 1 , 2.. m , j = 1 , 2.. k

其中 c(i)j c j ( i ) 表示第 i i 个样本所属的类。可以看出Kmeans算法只考虑了类内相似性,没有考虑类间相似性。对于Kmeans算法的求解采用EM算法,先假设类中心 c 1 1 , c 2 1 , . . , c k 1 ,然后根据相似性度量来划分所有样本点到 k k 类中(Kmeans是一种硬划分),根据划分后的样本点重新更新 k 类的类中心 c21,c22,..,c2k c 1 2 , c 2 2 , . . , c k 2 ,不断的迭代至稳定(类中心不再变化)。

KMeans算法流程:

1)随机初始化类中心

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值