AI 人工智能学习之聚类分析及算法(1)

逸剑听潮

已于 2022-10-29 10:25:16 修改

阅读量1k

点赞数 1

分类专栏： AI 人工智能文章标签：人工智能层次聚类欧氏距离 Birch算法归一化

于 2022-10-29 00:31:23 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/li_gf/article/details/127580675

版权

本文介绍了层次聚类的概念，包括凝聚型和分裂型聚类，并详细讲述了自下而上的合成聚类算法，强调了欧氏距离在相似度计算中的作用。此外，还讨论了Birch算法在大数据聚类中的优势以及数据归一化的重要性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

层次聚类

层次聚类(Hierarchical Clustering)是通过计算不同类别数据点间的相似度来创建一棵有层次的嵌套聚类树，不同类别的原始数据点是树的最低层，树的顶层是一个聚类的根节点。层次聚类算法分为两类：自上而下和自下而上。自下而上的算法在一开始就将每个数据点视为一个单一的聚类，然后依次合并类，直到所有类合并成一个包含所有数据点的单一聚类。

层次聚类可以分为两种主要类型：凝聚型（agglomerative）和分裂型（divisive）。

凝聚聚类：它也被称为AGNES（凝聚嵌套）。它以自下而上的方式工作。也就是说，每个对象最初被认为是单元素簇（叶子）。在算法的每个步骤中，将最相似的两个群集组合成新的更大的群集（节点）。迭代此过程，直到所有点都只是一个单个大簇（root）的成员（参见下图）。结果是一棵树，可以绘制为树状图。

分裂层次聚类：它也被称为DIANA（Divise Analysis），它以自上而下的方式工作。该算法是AGNES的逆序。它以root开头，其中所有对象都包含在单个集群中。在迭代的每个步骤中，最异构的集群被分成两个。迭代该过程，直到所有对象都在它们自己的集群中（见下图）。

合成聚类算法（自下而上）

合并算法

层次聚类的合并算法通过计算两类数据点间的相似性，对所有数据点中最为相似的两个数据点进行组合，并反复迭代这一过程。简单的说层次聚类的合并算法是通过计算每一个类别的数据点与所

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。