Deep Learning笔记之一：K-means特征聚类算法

托沃斯-勒夫

于 2015-06-03 15:01:43 发布

阅读量1.6w

点赞数

分类专栏：模式识别深度学习机器学习数据挖掘文章标签：机器学习深度学习模式识别数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gdut2015go/article/details/46345751

版权

本文介绍了非监督学习中的K-means和模糊C-means聚类算法，探讨了它们的工作原理、特点和应用场景。K-means算法以样本到聚类中心的距离最小化为目标，而模糊C-means则考虑样本对聚类的隶属度，允许样本模糊地属于多个聚类。文章还对比了两者对初始值的敏感性和类内样本的相似度需求。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

非监督学习：一些聚类算法

聚类是数据挖掘中用来发现数据分布和隐含模式的一项重要技术，聚类分析是指事先不了解一批样品中的每个样品的类别或者其他的先验知识，而唯一的分类依据是样品的特征，利用某种相似性度量的方法，把特征相同的或相近的分为一类，实现聚类分析。

下面介绍五种聚类方法,每个算法的使用是有限的，不同的聚类酸腐蚀可以解决不同的问题。

（一）K-means聚类

K均值算法是一种常用的动态聚类算法，K均值算法能够使聚类集中所有样本到聚类中心的距离和最小。原理为：先选K个初始距离中心，计算每个样本到这K个中心的距离，找出最小距离把样本归入最近的聚类中心，然后对中心进行修改，得到新的K个中心，再计算样本到K个中心的距离，重新归类，重新计算中心，修改中心。直到新的聚类中心等于聚类中心则结束。修改聚类中心的准则函数是：

K均值方法的特点：该算法的特点是运算结果受所选的聚类中心的数目，初始位置，模式样本的几何性质以及读入的次序的影响。在实际运用时，要试探选择不同的K值和起始聚类中心。如果模式样本为N个孤立的区域分布，则一般都能得到收敛结果。

（二）Kmedoid方法

Kmedoid方法同Kmeans方法类似࿰

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。