聚类算法属于机器学习中一种无监督学习算法。聚类方法一般可以分为层次聚类与非层次聚类两种。其中层次聚类算法又可以分为合并法与分解法;同样非层次聚类算法也可以分为多种,常用的有K-means算法。这篇博客先来实现层次聚类算法中的合并法,我会在下一篇博文中讲述K-means算法。
其中,合并法是指:初始阶段,将每个样本点当做其类簇,然后合并这些原子类簇直至达到预期的类簇数或者其他终止条件。
算法实现:
输入: K:目标类簇数D:样本点集合
输出:K个类簇集合
方法:
1)将D中各个样本点当做类簇集合
2)repeat
3) 找到分属两个不同类簇,且距离最近的样本点对
4) 将两个类簇合并
5) util 类簇数=K
下面,我将用如下数据集作做测试:
A | 2 | 3 |
B | 2 | 7 |
C | 1 | 2 |
D | 1 | 6 |
E | 2 | 1 |
F | 3 | 5 |
G | 8 | 5 |
H | 9 | 6 |