聚类算法应用广泛:模式识别,数据分析,图像识别及其他许多方面。
重要特性:要求同一类的数据对象尽可能的相似,不同类的数据对象尽可能地相异。
聚类和分类的根本区别在于:分类需要事先知道所依据的对象特征,而聚类是在不知道对象特征的基础上要找到这个特征。
聚类方法分类:基于划分的聚类方法,基于层次的聚类方法,基于密度的聚类方法,基于网格的聚类方法,和谱聚类方法。
由聚类所产生的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异,在许多应用中,可以讲一个簇中的数据对象作为一个整体来对待。聚类分析通常 作为一个独立的工具来获得数据分布的情况,观察每个簇的特点,集中对特定的某些簇做进一步分析,可作为其他算法如特征选择和分类等的预处理步骤。聚类要求