机器学习算法-层次聚类AGNES

本文介绍了层次聚类中的AGNES算法,这是一种自底向上的聚类策略。从每个对象作为独立簇开始,通过计算簇间距离合并最近的簇,直至满足预设终止条件。内容包括算法步骤、距离计算、举例说明、终止条件及算法性能分析,还提及了在scikit-learn中的实现和参数设置。
摘要由CSDN通过智能技术生成

层次聚类方法对给定的数据集进行层次的分解,直到某种条件满足为止。具体又可分为:
凝聚的层次聚类:一种自底向上的策略,首先将每个对象作为一个簇,然后合并这些原子簇为越来越大的簇,直到某个终结条件被满足。
分裂的层次聚类:采用自顶向下的策略,它首先将所有对象置于一个簇中,然后逐渐细分为越来越小的簇,直到达到了某个终结条件。

这里写图片描述

层次凝聚的代表是AGNES(AGglomerative NESting)算法。AGNES 算法最初将每个对象作为一个簇,然后这些簇根据某些准则被一步步地合并。两个簇间的相似度有多种不同的计算方法。聚类的合并过程反复进行直到所有的对象最终满足簇数目。

一、算法步骤

AGNES(自底向上凝聚算法)算法的具体步骤如下所示:
输入:包含 n 个对象的数据库。
输出:满足终止条件的若干个簇。
(1) 将每个对象当成一个初始簇;
(2) REPEAT
(3)     计算任意两个簇的距离,并找到最近的两个簇;
(4)     合并两个簇,生成新的簇的集合;
(5) UNTIL 终止条件得到满足。

二、距离计算

上述算法的关键在于如何计算聚类簇之间的距离?实际上每个簇是一个样本集合,因此只需要采用关于集合的某种距离即可。例如给定聚类簇 Ci Cj ,两个簇的距离可以通过以下定义得到:

dmin(Ci,Cj)=minpCi,qCj|pq|.

dmax(Ci,Cj)=maxpCi,qCj|pq|.

评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值