K-means算法思路总结

K-means算法是一种无监督学习的聚类方法,通过对数据对象的相似度进行划分,形成类簇。其过程包括随机初始化k个类中心,然后迭代地将数据点分配到最近的类中心并更新类中心,直至收敛或达到最大迭代次数。优点包括快速、高效且适合大规模数据。缺点则包括对异常值敏感,需预设K值,依赖初始质心选择,且仅适用于数值型数据和团状分布。为解决这些问题,可以尝试多次运行取最优结果,或使用其他聚类方法如谱聚类。
摘要由CSDN通过智能技术生成

k-means算法是一种聚类算法,所谓聚类,即根据相似性原则,将具有较高相似度的数据对象划分至同一类簇,将具有较高相异度的数据对象划分至不同类簇。聚类与分类最大的区别在于,聚类过程为无监督过程,即待处理数据对象没有任何先验知识,而分类过程为有监督过程,即存在有先验知识的训练数据集。k-means是一种无监督学习,它会将相似的对象归到同一类中。

k-means聚类的优缺点

优点:(1)算法快速、简单; 
          (2)对大数据集有较高的效率并且是可伸缩性的; 
          (3)时间复杂度近于线性,而且适合挖掘大规模数据集。K-Means聚类算法的时间复杂度是O(n×k×t) ,其中n代表数据集中对象的数量,t代表着算法迭代的次数,k代表着簇的数目  

缺点:(1)对异常值(噪声)敏感,可以通过一些调整(如中心值不直接取均值,而是找均值最近的样本点代替)

           (2)需要提前确定K值(提前确定多少类)

           (3)分类结果依赖于分类中心的初始化

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值