spss聚类分析_SPSS 聚类分析之K-均值聚类

聚类分析的定义

聚类分析指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。它是一种重要的人类行为。聚类分析的目标就是在相似的基础上收集数据来分类。

聚类分析的基本原理

根据样本的属性,使用某种算法计算相似性或者差异性指标,以确定每个个案之间的亲疏关系,最终将所有个案分为多个相似组(即聚类),同一聚类的个案彼此相同,不同聚类中的个案彼此不同。常见的聚类方法有K均值聚类法、系统聚类法(也叫层次聚类法)等。

简而言之,聚类分析根据样本的多个属性,将相似的对象聚为一类,使同类之间尽量同质、不同类之间尽量异质。在聚类分析中,一般的规则是将“距离”较小的点归为同一类,将“距离”较大的点归为不同的类。常见的是对个体分类,也可以对变量分类,但对于变量分类此时一般使用相似系数作为“距离”测量指标

聚类分析的应用

  • 聚类分析常用于对市场进行分群,在用户体验研究中,常用来根据用户的多种属性进行用户分群。
  • 设计抽样方案(分层抽样)
  • 预分析过程(先通过聚类分析达到简化数据的目的,将众多的个体先聚集成比较好处理的几个类别或子集,然后再进行后续的多元分析)

聚类分析的特征

  • 聚类分析简单、直观。
  • 聚类分析主要应用于探索性的研究,其分析的结果可以提供多个可能的解,选择最终的解需要研究者的主观判断和后续的分析。
  • 不管实际数据中是否真正存在不同的类别,利用聚类分析都能得到分成若干类别的解。
  • 聚类分析的解完全依赖于研究者所选择的聚类变量,增加或删除一些变量对最终的解都可能产生实质性的影响。
  • 异常值和特殊的变量对聚类有较大影响,当分类变量的测量尺度不一致时,需要事先做标准化处理。

聚类和分类的区别

  • 分类其实是从特定的数据中挖掘模式,作出判断的过程。聚类与分类的不同在于,聚类所要求划分的类是未知的。
  • 聚类的的目的也是把数据分类,但是事先我是不知道如何去分的,完全是算法自己来判断各条数据之间的相似性,相似的就放在一起。在聚类的结论出来之前,我完全不知道每一类有什么特点,一定要根据聚类的结果通过人的经验来分析,看看聚成的这一类大概有什么特点。

聚类分析的基本步骤总结

3b9f77867bd8241ab62da928759d5ce1.png

d2331b2d3a01f8ed454e7216a8b8bab6.png
聚类分析的步骤

d2cffd6468e1c865cbe19588a74862b6.png
聚类
  • 20
    点赞
  • 94
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值