SPSS聚类分析学习笔记

SPSS聚类分析

22-2李昊澄

数据集:SPSS Modeler18.0教程数据集

聚类分析是把研究对象按一些属性将变量或对象分成不同的组别,

对个案(样品、对象、被试)分类——Q型聚类

对变量分类——R型聚类

在这里插入图片描述

1.K-均值聚类(计算距离,距离相近的归为一类)

在这里插入图片描述

例:探究车的性能

(1)数据标准化(不同数据冈量差别大)

把对车性能指标有影响的指标标准化。在分析中选择描述统计,选择描述:
在这里插入图片描述
选择需要标准化的数据,移到左边,选择另存为变量,点击确定:
在这里插入图片描述
出现标准化后的数据
在这里插入图片描述

(2)开始聚类分析(只能对连续变量分析)

点击分析,分类,K-均值聚类

在这里插入图片描述

把需要均值聚类的变量都放到变量中:(只能对连续变量分析)
在这里插入图片描述

变量标注依据:标注分类依据,如标注每台车型属于哪一类

在这里插入图片描述

聚类数量:分成几类??多尝试几次看效果

在这里插入图片描述

迭代次数写大点,迭代到最终结果会自己停:
在这里插入图片描述

在这里插入图片描述

保存:勾选聚类成员(在生成结果中生成新变量,标注式哪一类)

勾选与聚类中心聚类(在生成结果中生成与聚类中心距离)
在这里插入图片描述
在这里插入图片描述

选项:选择初始聚类中心和ANOVA表(显示初始聚类分析类别之间是否有差异)

在这里插入图片描述
在这里插入图片描述

(3)计算结果

点击确定,得到计算结果

在这里插入图片描述

(1)通过聚类分析分类

聚类中心大于0(高于均值),小于0(低于均值)

根据结果分析,第一类低排量低马力…高燃油效率(经济型车),第二类高排量高马力低燃油效率(非经济型车)

在这里插入图片描述

(2)判断聚类是否成功的方法

观察 F 值和显著性
  • F 值越大,说明不同聚类之间的均值差异越大,聚类效果越好。
  • 显著性 p 值(Sig.)

p < 0.05(通常使用的显著性水平 α = 0.05)

  • 说明差异显著,拒绝 原假设(H₀),接受 备择假设(H₁)
  • 变量之间存在显著性差异。

p < 0.01(更严格的标准)

  • 差异非常显著,变量之间的关系更为可靠。

p < 0.001

  • 极为显著,数据之间的差异几乎不可能是随机出现的。

p ≥ 0.05

  • 差异不显著,无法拒绝 原假设(H₀),说明数据之间可能没有统计学上的显著差异。

在这里插入图片描述

(3)分类较为均匀:分类后每类个数相近

在这里插入图片描述

在这里插入图片描述

绘制三线表

(1)聚类中心表

将聚类中心表复制粘贴到excel中,给分好的类别起名,记录分类个数(N=),调整边框颜色粘贴到WORD中:

在这里插入图片描述

(2)ANOVA表

显著性写小数点后三位

在这里插入图片描述

2.系统聚类(计算距离,两两类合并,看何使最佳,样本量要小<40)

在这里插入图片描述

(1)系统聚类:分析——》分类——》系统聚类
在这里插入图片描述

放入系统变量,不需要标准化

系统聚类可以对连续变量或者系统变量分类,但只能选其一,不能同时。(选择针对个案还是变量)

在这里插入图片描述

统计:勾选集中计划
未知聚类成员数量,选“无”

在这里插入图片描述

图:谱系图/树状图+冰柱图

在这里插入图片描述

方法:聚类方法:组间联培(最常用)

区间:连续变量——》平方欧式距离

计数——》卡方测量

二分(二元)——》平方欧式距离

可选标准化(Z)按变量/个案

在这里插入图片描述

(2)聚合系数随分类数变化图

在这里插入图片描述

左行写(集中计划)系数,右行写类数(右行持续-1)

选中两列做折线图:插入——》推荐图表——》散点图

散点图哪里开始平缓取那里的分类数

在这里插入图片描述

在这里插入图片描述

分5类
在这里插入图片描述

3.二阶聚类

可以同时对分类变量和连续变量聚类

距离测量

在这里插入图片描述

对数似然:分类变量和连续变量

欧式:全来连续变量

在这里插入图片描述

在这里插入图片描述

选项:

看情况离群处理,内存分配不动,选择需要标准化的变量在右边(默认),不需要标准化的在左边(需移动)。

在这里插入图片描述

输出:
在这里插入图片描述
在这里插入图片描述
参考资料:【基于SPSS的聚类分析(含k-均值聚类,系统聚类和二阶聚类)】 https://www.bilibili.com/video/BV1B8411W7kC/?p=2&share_source=copy_web&vd_source=9903ca38c53f73d34148fc06464b1432

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值