K-means clustering 介绍论文

最新推荐文章于 2024-10-24 13:56:32 发布

vivien_shaw

最新推荐文章于 2024-10-24 13:56:32 发布

阅读量4.1k

点赞数

本文详细介绍了k-means算法的基本概念、工作流程、优缺点及在数据挖掘领域的应用。通过阐述算法原理和实例分析，揭示了如何将k-means应用于复杂数据集的聚类任务中，同时指出了其局限性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

http://blog.csdn.net/kingskyleader/article/details/6064838

以下摘自原文：

介绍k-means算法
把数据分成几组，按照定义的测量标准，同组内数据与其他组数据相比具有较强的相似性，这就叫聚簇[4]。聚簇是数据挖掘最基础的操作，但现在存在的一些传统聚簇方法已不能满足处理复杂类型的、高维的、任意分布形状的数据集合的需要。
k-means 算法就是用得最多的一种传统的聚簇方法，是一种划分法，相似度的计算是求数据对象与簇中心的距离，与簇中心距离近的就划为一个簇。其工作流程如下：

首先，随机地选择k个对象，每个对象初始地代表了一个簇的平均值或中心。对剩余的每个对象，根据其与各个簇中心的距离，将其赋给最近的簇。然后重新计算每个簇的平均值，求出新的簇中心，再重新聚簇。这个过程不断重复，直到准则函数收敛。该算法的时间复杂度是O（nkt），其中n是所有对象数目， k是簇的数目，t是迭代次数。它的效率比较高；缺点是只能处理数值型数据，不能处理分类数据，对例外数据非常敏感，不能处理非凸面形状的聚簇。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。