参考文献:《数据分析:企业的贤内助》
案例数据如下:
不同收入的用户对A卖场的品类满意度
直接得出低收入者的满意度高于中收入者高于高收入者是不正确的。
因为满意度得分的差异来自于两个方面:组内差异和组间差异。
在这里表现为,组间差异是由于收入的不同所引起的用户满意度差异,
组内差异是同样收入水平下,由于其他因素(如随机抽样)所引起的用户满意度差异。
只有当满意度差异来自于收入水平(组间差异),而不是其他因素(即组内差异)时,才能说明收入影响满意度,不同收入的用户满意度不同。
如何判断差异来源呢?
选用方差分析,具体操作如下:
第一步:数据编码,设低收入、中收入和高收入的编码分别为1、2、3,得到原始数据表
本来想用R来计算得,但是没有原始数据,所以以下均为书的内容解释
首先进行方差同质性检验,用来检验能否做方差分析,方差分析的前提是各组总体方差没有显著差异