1 两因素方差分析的形式
多因素方差分析针对的是多因素完全随机设计。包含两个及以上的自变量,为便于讲解,本文以两因素方差分析为例。
在一个两因素完全随机设计中,自变量
包含
,共
个水平。自变量
包含
,共
个水平。总共形成
个处理。各处理
之下有
个观测值。特别的,当各处理的观测值都为
时,称为等组设计。
等组设计的具体形式如下:
若各组观测值
数量不同,称为非等组设计,形式如下:
其中
各不相同
两因素方差分析的逻辑是对变异进行比较。通过对平方和(Sum of Squares)和自由度(Degree of Freedom)的分解,利用公式:
计算出各主效应方差,交互作用方差和组内方差(即误差方差)。各主效应和交互作用的方差与误差方差的差异(比值)体现了该效应的显著性。而且在零假设为真的情况下,该比值服从F分布,进而分别完成各效应的假设检验。
具体的分解如下图:
常规的流程大家都非常熟悉,不再赘述。接下来换个角度,从多元线性回归来看一看两因素方差分析。
2 两因素方差分析的线性模型
模型的基本形式
两因素方差分析的线性模型可以表示为:
其中
指A因素第
个水平的效应,
指
因素第
个水平的效应,
指A因素第
个水平与B因素第
个水平的交互作用效应,
表示
处理中,第
个观测值的随机误差。该式说明:某个观测值等于其所在处理的各主效应和交互作用效果叠加,并附加上一个随机误差组成。
通常,我们让: