聚类分析

最新推荐文章于 2025-03-13 18:16:15 发布

LeonJay2012

最新推荐文章于 2025-03-13 18:16:15 发布

阅读量1w

点赞数

分类专栏：机器学习/数据挖掘文章标签：机器学习聚类

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sugar737/article/details/70160846

版权

本文详细介绍了聚类分析的三种主要方法：划分聚类（K均值）、层次聚类（凝聚和分裂）以及基于密度的聚类（DBSCAN）。K均值简单易懂，但对初始值敏感；层次聚类能发现类的层次关系，但计算复杂度高；DBSCAN能发现任意形状的簇，但对高维数据处理困难。理解这些算法的优缺点有助于选择合适的聚类方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

概要：

聚类分析仅根据在数据中发现的描述对象及其关系的信息，将数据对象分组。其目标是，组内的对象相互之间是相似的（相关的），而不同组中的对象是不同的（不相关的）。组内的相似性（同质性）越大，组间差别越大，聚类就越好。

应用场景：

聚类。

聚类分析的3种大类和其代表技术：

划分聚类法。K均值。是基于原型的、划分的聚类技术。它试图发现用户指定个数K的簇（由质心代表）。
层次聚类。凝聚的层次聚类。开始，每个点作为一个单点簇；然后，重复地合并两个最靠近的簇，直到产生单个的、包含所有点的簇。
基于密度的聚类。DBSCAN。是一种产生划分聚类的基于密度的聚类算法，簇的个数由算法自动地确定。低密度区域中的点被视为噪声而忽略，因此DBSCAN不产生完全聚类。

层次聚类的优缺点：

优点：

距离和规则的相似度容易定义，限制少；
不需要预先指定聚类数；
可以发现类的层次关系；
可以聚类成其他形状。

缺点：

计算复杂度太高；
奇异值也能产生很大影响；
算法很可能聚类成链状。

DBSCAN的优缺点：

优点：

不需要事先知道要形成的簇的数量。
可以发现任意形状的簇类。
对噪声点不敏感。
对样本点的顺序不敏感。

缺点：

簇的密度变化太大时，

最低0.47元/天解锁文章

博客等级

码龄17年

7
原创

1
点赞

9
收藏

2
粉丝

关注

私信

TA的精选

新朴素贝叶斯分类
486 阅读
新 KNN最近邻
427 阅读
热支持向量机
3894 阅读
热人工神经网络
3501 阅读
热决策树
613 阅读

分类专栏

机器学习/数据挖掘 7篇

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。