聚类算法之AGNES

1. 算法描述

AGNES(AGglomerative NESting)算法是凝聚的层次聚类方法。AGNES最初将每个对象作为一个簇,然后这些簇根据某些准则被一步一步地合并。例如,在簇A中的一个对象和簇B中的一个对象之间的距离是所有属于不同簇的对象之间最小的,AB可能被合并。这是一种单链接方法,其每一个簇都可以被簇中所有对象代表,两个簇间的相似度由这两个簇中距离最近的数据点的相似度来确定。聚类的合并过程反复进行直到所有的对象最终合并形成一个簇。在聚类中,用户能定义希望得到的簇数目作为一个结束条件。

输入:包含n个对象的集合,终止条件簇的数目k
输出:k个簇
1、将每个对象当成一个初始簇
2、Repeat
3、根据两个簇中最近的数据点找到最近的两个簇
4、合并两个簇,生成新的簇的集合
5、知道达到定义的簇的数目

2. 算法性能分析

2.1 优点

  1. 简单,理解容易

2.2 缺点

  1. 合并点/分裂点选择不太容易
  2. 合并/分类的操作不能进行撤销
  3. 大数据集不太适合
  4. 执行效率较低O(t*n2),t为迭代次数,n为样本点数
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值