SPSS为我们提供了探索分析,所谓探索分析之所以是探索,是因为有时候我们对于变量的分布特点不是很清楚,探索的目的在于帮助我们完成以下的工作:
识别数据:例如数据的分布形式、异常值、缺失值;
正态性检验:服从正态分布的检验;
方差齐性检验:不同数据组的方差是否相等。
有关于方差齐性检验原理、正态分布这里不累述,这里主要介绍SPSS的探索分析使用。
数据文件
这里使用的文件是不同周期的充值用户的充值数据,这里主要是针对流失用户和活跃用户的充值数据。
具体操作
首先将源文件加载到SPSS中,选择菜单分析|描述统计|探索,如下图所示:
在该对话框中,有几个输入的位置:
因变量:为我们要分析的目标变量,变量多是连续性变量居多。
因子:是目标变量的分组,本例中,就是针对充值用户的充值金额进行分组,比如活跃和流失两组。
标注个案:对于异常值进行标注,识别异常值。
在此处,我们因变量选取充值总额,因子选取用户状态,标注个案我们选取服务器ID,如下图所示:
<