1. 聚类的适用场景
· 用户画像
· 用户分类
· 产品竞品分析
2. 三种常见的聚类方法及适用条件
聚类方法 | 数据变量类型条件 | 数据体量条件 | 类簇确定方式 |
---|---|---|---|
K-means | 变量相互独立,变量是数值型连续型变量且服从正态分布 | 适用于大数据量 | 人工指定 |
二阶聚类 | 分类变量或数值型连续变量均可,分类变量呈多项式分布,数值型连续变量呈正态分布,变量相互独立 | 适用于大数据量 | 人工指定/系统自动 |
系统(层次)聚类 | 分类变量或数值型连续变量均可,分类变量呈多项式分布,数值型连续变量呈正态分布,变量相互独立 | 适用于大数据量 | 人工指定/系统自动 |
(Ps:多项式分布是二项式分布的拓展,也就是在三种及以上的选择中选择一个的意思)