层次聚类算法将相似的对象分组到称为聚类的组中。层次聚类算法有两种:
- 凝聚(Agglomerative )-自下而上的方法。从许多小聚类开始,然后将它们合并到一起,创建更大的聚类。
- 分裂 (Divisive )- 自上而下的方法。从单个聚类开始,而不是将其拆分为更小的聚类。
层次聚类的一些优缺点
优点
- 不假设特定数量的聚类(即k均值)
- 可能对应于有意义的层次关系
缺点
- 一旦决定组合两个聚类,它就无法撤消
- 遇到大机器学习数据集时太慢,
它时如何运作的
1.使每个数据点成为一个聚类
2.取两个最接近的聚类并使它们成为一个聚类
3.重复步骤2,直到只有一个聚类