方差分析ANOVA
anova, analysis of variance, 方差分析, 又称"变异数分析", 用于两个或两个以上样本均数差别的显著性检验.
由于各种因素的影响, 观测数据呈现波动的形状, 造成波动的原因可以分为:
- 不可控的随机因素
- 可控因素, 这是在研究中施加的控制结果的参数引起的
组间变异和组内变异
换个角度理解, 任何观察值的总变异都可以分解为组间变异和组内变异. 假设n为样本总数, m为组数.
-
总变异(total variation)
所有测量值之间总的变异程度 :
S S T = ∑ i = 1 m ∑ j = 1 m i ( X i j − X ˉ ) 2 SS_T = \sum_{i=1}^{m} \sum_{j=1}^{m_i} (X_{ij}-\bar{X})^2 SST=i=1∑mj=1∑mi(Xij−Xˉ)2 -
组间变异
各组均数与总均数的离均差平方和:
S S b = ∑ i = 1 m m i ( X i ˉ − X ˉ ) 2 SS_b =\sum_{i=1}^{m} m_i(\bar{X_i}-\bar{X})^2 SSb=i=1∑mmi(Xiˉ−Xˉ)2
组间变异反映了各组均数的变异程度, 组间变异=随机误差+处理因素作用 -
组内变异
用各个组内测量值 X i j X_{ij} Xij 与其所在组的均数差值的平方和来表示
S S w = ∑ i = 1 m ∑ j = 1 m i ( X i j − X i ˉ ) SS_w = \sum_{i=1}^{m} \sum_{j=1}^{m_i}(X_{ij}-\bar{X_i}) SSw=i=1∑m