层次聚类AGNES与DIANA

本文介绍了两种层次聚类算法——AGNES(Agglomerative Nesting)和DIANA(Divisive Analysis)。AGNES采用自底向上的合并策略,根据最小、最大或平均距离进行簇合并,而DIANA采取自顶向下的分裂策略,通过找到直径最大簇并不断分裂来形成簇。文中还详细说明了这两种算法的原理和Python实现。
摘要由CSDN通过智能技术生成

1. AGNES

AGNES是一种采用自底向上合并策略的聚类算法,其思想为:初始将所有样本看成一个簇,然后在每一轮过程中将距离最近的两个簇合并为一个簇,簇的个数不断减少到人为指定的聚类簇数K,终止算法。该算法关键在于如何度量两个簇的距离,集合间的距离计算有如下方式:
最 小 距 离 : d i s t ( C i , C j ) = m i n [ x ∈ C i , z ∈ C j ] ∣ ∣ x − z ∣ ∣ 2 最 大 距 离 : d i s t ( C i , C j ) = m a x [ x ∈ C i , z ∈ C j ] ∣ ∣ x − z ∣ ∣ 2 平 均 距 离 : d i s t ( C i , C j ) = 1 ∣ C i ∣ ∣ C j ∣ ∑ x ∈ C i ∑ z ∈ C j ∣ ∣ x − z ∣ ∣ 2 \begin{aligned} 最小距离:dist(C_i,C_j) &= min_{[x\in C_i,z\in C_j]}||x-z||_2 \\ 最大距离:dist(C_i,C_j) &= max_{[x\in C_i,z\in C_j]}||x-z||_2 \\ 平均距离:dist(C_i,C_j)&=\cfrac{1}{|C_i||C_j|}\sum_{x\in C_i}\sum_{z\in C_j}||x-z||_2 \end{aligned} dist(Ci,Cj)dist(Ci,Cj)dist(Ci,Cj)=min[xCi,zCj]xz2=max

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值