之前写的那一篇太啰嗦了,索性删了,重新发。
1 单因素方差分析的形式
单因素方差分析针对的是单因素完全随机设计。只有一个自变量
,包含
,共
个水平,各水平之下有
个观测值。特别的,当各水平的观测值都为
时,称为等组设计。
等组设计的具体形式如下:
若各组观测值
数量不同,称为非等组设计,形式如下:
其中
各不相同
单因素方差分析的逻辑是对变异进行比较。通过对平方和(Sum of Squares)和自由度(Degree of Freedom)的分解,计算出组间平方和,组间自由度,组内平方和,组内自由度。进一步通过公式:
计算出组间方差和组内方差。此时组间方差包含了处理带来的变异,以及误差带来的变异;组内方差只包含了误差带来的变异,二者的差异(比值)体现了处理的显著性。而且在零假设为真的情况下,组间方差与组内方差的比值服从F分布,进而完成假设检验。
常规的流程大家都非常熟悉,接下来我们换个角度,从多元线性回归来看一看单因素方差分析。
2 单因素方差分析的线性模型
模型的基本形式
单因素方差分析的线性模型可以表示为:
其中
指第
个处理的效应,
表示第
个处理中,第
个观测值的随机误差。该式说明:某个观测值等于其所在的处理效果,附加上一个随机误差组成。
通常,我们让: