一、方差分析
1.1 主题
- 因子、水平、单因素方差分析、双因素方差分析、协方差分析
二、 基本概念
-
方差分析: 通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。
-
因素/因子: 所要检验的对象称为因素或因子。
-
水平/处理: 因素的不同表现称为水平或处理。
-
观测值: 在每个因子水平下得到的样本数据称为观测值。
三、 单因素方差分析
1.1 概念
单因素方差分析: 是用来研究一个控制变量的不同水平是否对观测变量产生了显著影响。这里,由于仅研究单个因素对观测变量的影响,因此称为单因素方差分析。
1.2 步骤:
单因素方差分析基本步骤:
1、提出原假设:H0——无差异;H1——有显著差异
2、选择检验统计量:方差分析采用的检验统计量是F统计量,即F值检验。
3、计算检验统计量的观测值和概率P值:该步骤的目的就是计算检验统计量的观测值和相应的概率P值。
4、给定显著性水平,并作出决策
1)提出假设
通过检验因素的k个水平均值是否相等,来判断自变量与因变量是否相关。
H0: μ1=μ2=…=μi=…μk (自变量对因变量没有显著影响)
H1: μ1,μ2,…μk不全相等(自变量对因变量有显著影响)
2)构造检验统计量
需要构件三个误差平方和,总平方和(SST)、组间平方和(SSA)和组内平方和(SSA)
且SST=SSA+SSE
SST:全部观测值与总均值的误差平方和。公式为:
SSA:各组均值与总均值的误差平方和,反映各样本均值之间的差异程度。公式为:
SSE:每个水平或组的样本数据与其组均值的误差平方和。公式为:
3)计算统计量
各平方误差除以它们所对应的自由度,称为均方。
SST的自由度为n-1,其中n为全部观测值个数;
SSA的自由度为k-1,k为因素水平的个数
SSE的自由度为n-k。
MST=SST/n-1;
MSA=SSA/k-1;
MSE=SSE/n-k;
则F=MSA/MSE~F(k-1,n-k)分布
4)统计决策
在给定显著性水平α下,计算F(k-1,n-k)分布的Fα,如果F>Fα,则拒绝原假设,表明自变量对因变量影响显著。
5)关系强度检验R2
R2越大,表明影响越显著
四、 双因素方差分析
涉及到两个维度,可以使用二维数组方式表示两个维度上的观测值。两个自变量,可以分为行因素和列因素。
1.1 步骤:
1.1.1 提出假设
分别对行、列因素提出假设
对行因素提出的假设为:
1.1.2 构造检验统计量
总平方和是全部样本观察值与总的样本均值的误差平方和,记为SST,即
根据各个平方和对应的自由度,可以计算出对应的均方:
1.1.3 作出统计决策