目录
(一)层次聚类法(hierarchical cluster procedures)
一、定义
根据研究对象的特征对研究对象进行分类,使得同一类个体之间有高度的同质性,不同类的个体之间有较高的异质性。
聚类分析是一种探索性的分析,在分类的过程中,人们不必事先给出一个分类的标准,聚类分析能够从样本数据出发,自动进行分类。聚类分析所使用方法的不同,常常会得到不同的结论。不同研究者对于同一组数据进行聚类分析,所得到的聚类数未必一致。
从实际应用的角度看,聚类分析是数据挖掘的主要任务之一。而且聚类能够作为一个独立的工具获得数据的分布状况,观察每一簇数据的特征,集中对特定的聚簇集合作进一步地分析。聚类分析还可以作为其他算法(如分类和定性归纳算法)的预处理步骤。
聚类分析在SPSS26中的位置:“分析”——“分类”,再选择相应的聚类方法即可。
二、常用的聚类分析方法
聚类方法 |
聚类对象 |
变量类型 |
分类数 |
样本容量 |
系统聚类 |
个案或变量 |
连续或分类 |
固定分类或指定范围 |
<200 |
K-均值聚类 |
个案 |
连续 |
固定分类数 |
大样本 |
二阶聚类 |
个案或变量 |
连续或分类 |
系统自动确定 |