聚类模型-原型聚类-KMeans

最新推荐文章于 2024-08-20 22:43:27 发布

myazi

最新推荐文章于 2024-08-20 22:43:27 发布

阅读量3.1k

点赞数 1

分类专栏：机器学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u010865478/article/details/82708536

版权

本文介绍了聚类模型中的KMeans算法，详细阐述了KMeans的类表示、失真函数定义以及算法流程，并对比了与模糊C均值聚类的区别。KMeans算法存在对初始值敏感、需要预设聚类数量等问题，适用于基于距离度量的聚类场景。

摘要由CSDN通过智能技术生成

聚类模型

1、层次聚类

2、原型聚类-K-means

3、模型聚类-GMM

4、EM算法-LDA主题模型

5、密度聚类-DBSCAN

6、图聚类-谱聚类

二、原型聚类-KMeans

KMeans的类表示是聚类中心点，以点 $x_{i}$ 来表示类，相似性度量同样可以采用常用的距离度量。根据类紧致性准则定义失真函数为所有样本点到该样本所在类中心的失真程度和最小。

J (c) = \sum i = 1 m | | x (i) - c (i) j | | 2, i = 1, 2.. m, j = 1, 2.. k

$J(c)=\sum_{i=1}^{m}||x^{(i)}-c_{j}^{(i)}||^2,i=1,2..m,j=1,2..k$
其中

c(i)j c j ( i ) $c_{j}^{(i)}$ 表示第

i i $i$ 个样本所属的类。可以看出Kmeans算法只考虑了类内相似性，没有考虑类间相似性。对于Kmeans算法的求解采用EM算法，先假设类中心

c_{1}^{1}, c_{2}^{1}, . ., c_{k}^{1}

$c_{1}^{1},c_{2}^{1},..,c_{k}^{1}$ ，然后根据相似性度量来划分所有样本点到

k k $k$ 类中（Kmeans是一种硬划分），根据划分后的样本点重新更新

k

$k$ 类的类中心

c21,c22,..,c2k c 1 2 , c 2 2 , . . , c k 2 $c_{1}^{2},c_{2}^{2},..,c_{k}^{2}$ ，不断的迭代至稳定（类中心不再变化）。

KMeans算法流程：

1）随机初始化类中心

最低0.47元/天解锁文章

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。