1.前提条件
(1)独立性:即样本数据相互独立,互不干扰
(2)正态性
a.统计检验法
样本量>50:K-S检验
样本量<50:S-W检验
大数据样本:J-B检验(原理: 是结合偏度系数和峰度系数进行正态性检验)
找类型,看p值,p>0.05则不显著,符合正态性。
b.描述法
由于统计检验法很难所有项都满足,所以结合描述法(峰度和偏度),当峰度绝对值<10,偏度绝对值<3,虽不是绝对正态,但基本符合正态。
c.图示法
直方图:分布呈钟型
P-P图:其原理在于如果数据正态,那么数据的累积比例与正态分布累积比例基本保持一致。分别计算出数据累积比例,和假定正态时的数据分布累积比例;并且将实际数据累积比例作为X轴,将对应正态分布累积比例作为Y轴,作散点图。(来源知乎)
散点近似一条对角直线,则说明为正态分布。
Q-Q图:其原理在于如果数据正态,那么其假定的正态分位数会与实际数据基本一致。计算出假定正态时的数据分位数;并且将实际数据作为X轴,将假定正态时的数据分位数作为Y轴,作散点图。(来源知乎)
散点近似一条对角直线,则说明为正态分布。
(3)方差齐性
解释:
方差齐性(homogeneity of variance),也称变异的同质性,即各组样本所来自总体的方差相同。
对于两个或多个我们将要检验或分析的总体其数据具有离散程度特点的一致性程度。
一般来说,可以将其形象理解为总体的数据分布疏密胖瘦与总体二的数据分布疏密胖瘦的一致性程度。(来源知乎)
判断方法:
p>0.05则不显著,满足方差齐性检验。
2.分析过程
双因素方差分析分为主效应分析和交互效应分析。
(1)主效应分析
解释:单独自变量X对因变量Y的影响的差异
判断:p<0.05则显著,主效应存在(图片来源百度)
(2)交互效应分析
解释: 对因变量Y的影响的差异
判断:同上(图片来源百度)
3.其他分析
简单效应是指自变量X1在某水平时,自变量X2不同水平之间的差异比较。而当主效应存在是,可以进行事后多重比较。事后多重比较是指存在主效应的自变量X,其不同水平两两之间的差异对比。
(1)简单效应
略
(2)事后多重比较
略