方差分析(ANOVA)
用于分析定类数据与定量数据之间的差异情况。可用于多组数据的对比。
- 定类:可以理解为特征。
- 多组:特征的多个取值。
- 定量:分析的指标。
比如学历为本科以下,本科,本科以上共三组学生的网购满意度是否有差异。
- 定类:学历。
- 多组:本科下,本科,本科上(3组)。
- 定量:学生网购满意度。
刚刚的例子属于单因素方差分析。单因素指的是定类数量为一个(学历)。两个及以上的特征称为多因素(eg:学历、性别)。
方差分析时,首先分析p值,如果此值小于0.05,说明呈现出差异性;具体差异再对比平均值即可。如果p 值大于0.05则说明没有差异性产生。
下图是定类为学历时,三组学历,对服务态度、服务质量评分的结果。(PS:这里定量是两个量,分别计算完服务态度后,同样步骤再计算服务质量即可。)
- “淘宝客服服务态度”呈现出0.01水平的显著性差异差异态度(F=69.38,p =0.00<0.01),具体通过平均值对比差异可知:相对来看,学历越高的样本人群,他们对于“淘宝客服服务态度”的认可态度会越高。
- “淘宝商家服务质量”现出0.01水平的显著性差异(F =49.70,p =0.00 <0.01),具体通过平均值对比差异可知:相对来看,学历越高的样本人群,他们对于“淘宝商家服务质量”的认可态度会越高。
理论上,方差分析有两个前提条件
- 一是因变量Y需要满足正态性要求
- 二是满足方差齐检验。
效应值
- 当呈现出显著差异性(前提),可分析差异,同时还可以分析差异幅度(即效应量)。
- 方差分析时,通常使用
η
2
\eta^{2}
η2表示效应量
计算公式: η 2 = S S A S S T \eta^{2}=\frac{SSA}{SST} η2=SSTSSA SSA表示组间差,SST为总差异; - 偏Eta方值介于0~1之间,该值越大说明差异幅度越大,比如偏Eta方为0.1,即说明数据的差异有10%是来源于不同组别之间的差异,一般情况下偏Eta值非常小,使用偏Eta方表示效应量大小时,效应量小、中、大的区分临界点分别是:0.01,0.06和0.14;
- 同时还可以使用Cohen’s f 表示效应量
计算公式: η 2 1 − η 2 \sqrt{\frac{\eta^{2}}{1-\eta^{2}}} 1−η2η2
Cohen’s f 表示效应量大小时,效应量小、中、大的区分临界点分别是:0.10,0.25和0.40。
参考资料:
https://spssau.com/front/spssau/helps/universalmethod/onewayanova.html