1聚类分析
聚类分析是一种探索性的分析,是将数据分到不同的类的一个过程。分类过程中,人们不必事先给出一个分类的标准,聚类分析能够从样本数据出发,自动进行分类。同一个类中的对象有很大的相似性,而不同类间的对象有较大的差异性。
传统的统计聚类分析方法包括系统聚类法、分解法、加入法、动态聚类法、有序样品聚类、有重叠聚类和模糊聚类等。采用k-均值、k-中心点等算法的聚类分析工具已被加入到许多著名的统计分析软件包中,如SPSS、SAS等。因此所使用方法的不同,常常会得到不同的结论。
从实际应用的角度看,聚类分析是数据挖掘的主要任务之一。而且聚类能够作为一个独立的工具获得数据的分布状况,观察每一类数据的特征,集中对特定的聚类集合作进一步地分析。聚类分析还可以作为其他算法(如分类和定性归纳算法)的预处理步骤。
分类通常我们将根据分类对象<