IBM SPSS Statistics探索性分析是描述统计中的一种分析方法,提供了数据过滤、离群值识别、假设检验等分析功能。
探索性分析中比较常用的功能是,通过数据过滤的功能,如分析数据中的极值、平均值、方差等,识别数据中的异常值;或使用检验的方法,判断后续使用的统计分析方法是否合适等,比如数据的正态分布假设是否成立。
一、示例数据
本文中,我们将会分析一组包含性别、客单价的数据。
通过探索性分析,查看数据中是否存在一些异常值,以及检验不同性别的客单价数据是否符合正态分布。
为什么要检验数据是否正态分布?这是因为在一些相关性分析(或其他分析)中,是以数据正态分布为前提进行统计分析的,如果数据不满足正态分布的假设,分析得出的结果就会不准确。
图1:示例数据
二、应用探索性分析
如图2所示,我们先打开IBM SPSS Statistics的探索分析选项(分析-描述统计-探索),然后再逐步演示操作。
图2:探索性分析
1、选择变量
如图3所示&#