点击上方“中国统计网”设置星标哦!
聚类分析也称群分析或点群分析,它是研究多要素事物分类问题的数量方法,是一种新兴的多元统计方法,是当代分类学与多元分析的结合。
聚类分析的基本原理是,根据样本的属性,使用某种算法计算相似性或者差异性指标,以确定每个个案之间的亲疏关系,最终将所有个案分为多个相似组(即聚类),同一聚类的个案彼此相同,不同聚类中的个案彼此不同。常见的聚类方法有K均值聚类法、系统聚类法(也叫层次聚类法)等。
聚类分析常用于对市场进行分群,在用户体验研究中,常用来根据用户的多种属性进行用户分群。
01 K-means算法
K均值算法比较简单,在SPSS中也被成为快速聚类,K均值算法中的每个类都是使用对象的平均值来表示。
步骤:
1. 将所有对象随机分配到k个非空的类中。
2. 计算每个类中所有对象的平均值,表示