聚类是数据挖掘中,用于发现数据分布和隐含模式的一项重要技术。
数据挖掘中现有的聚类算法,根据其基本思想可以分为五类:
- 层次聚类算法(又分为聚合聚类,分解聚类)
- 分割聚类算法(又分为基于密度的聚类、基于网格的聚类、基于图论的聚类、基于平方误差的迭代重分配聚类)
- 基于约束的聚类算法
- 机器学习中的聚类算法(人工神经网络方法、基于进化理论的方法:如模拟退火、遗传算法)
- 用于高维数据的聚类算法(分为子空间聚类、联合聚类)
层次聚类算法
层次聚类:将数据组织成若干组,并形成一个相应的树状图来进行聚类。
分为:自底向上的聚合层次聚类,自顶向下的分解层次聚类。