常用聚类算法

yanzi-000

于 2020-06-22 15:33:21 发布

阅读量873

点赞数

分类专栏：学习笔记 ML

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xuchuyan/article/details/106902960

版权

本文详细介绍了三种常用的聚类算法：K-means、Mean Shift和DBSCAN。K-means依赖预设聚类数量，适用于大规模样本；Mean Shift自动生成聚类数量，对密度敏感；DBSCAN基于密度划分聚类，能处理任意形状的簇。文章还讨论了算法的优缺点和参数调整策略。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在直观印象中,说起聚类算法,首先想到的k-means.

k-means作为经典的聚类算法,应用范围很广,但是在运行前要指定聚类的数量n,这个值对于最终的计算结果有很大的影响.而现在也没有通用的方法来得到这个值.

本文介绍了包括k-means在内的多种聚类算法,可以在实际中灵活使用.

聚类常用算法

K-means
Mean-Shift Clustering algorithm
DBSCAN, Density-Based Spatial Clusting of Applications with Noise
EM using GMM, Expectation-Maximization(EM) Clusting using Gaussian Mixture Models
Agglomerative Hierarchical Clustering

scikit-learn中各种聚类方法

1 K-means

KMeans算法聚类数据,是通过将不同样本分离成方差相等的n组,最小化惯性(inertia)或者叫类内平方和(within-cluster sum-of-squares).这个算法需要指定聚类的数量.可应用于大量样本的情况,在很多不同领域有大量的应用.

K-means算法将一个样本数量N的集合X划分成K个类别C,每个类别被描述成该类别下样本的平均值uj.通常把这些平均值称为’质心’,注意到通常情况下这些质心并不是集合X中的点,尽管他

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。