转自个人微信公众号【Memo_Cleon】的统计学习笔记:协方差分析:方差分析与线性回归的统一。
在进行数据分析时,有时候我们会遇到数据基线不平的情况,比如两样本的t检验的示例,比较Labe和Meto用药13周的降压效果,但一开始用药的时候两组舒张压的差别便有统计学意义。除了文中使用的差值比较,协方差分析是一个非常不错的选择。
协变量是对观察结果有影响但无法或难以控制的因素。协方差分析是通过直线回归的方式把协变量值化为相等(协变量取值其总均数)后求得因变量的修正均数,以此控制混杂因素的影响后,用方差分析比较修正均值间的差别。
适用条件:
(1)协变量为连续变量,且各组因变量与协变量呈线性关系;
(2)各组因变量残差呈正态分布;
(3)各组因变量残差等方差;
(4)各组因变量和协变量的回归线平行,即斜率相等。也就是要求对于不同的自变量,协变量对因变量的影响相同。如不满足平行线假定,说明自变量和协变量存在交互作用,他们会同时对因变量产生影响,这样混杂起来我们就无法控制协变量。
(5)在考察因变量与协变量的线性关系时,严格来讲也需要考察建立每条回归直线的前提:线性趋势、独立、正态、方差齐、不存在多重共线、无明显异常点等,具体可参考“多因素线性回归”。
示例“两独立样本的t检验”数据来自excel的自动生成,没有任何实际意义。严格来说,本例因变量与协变量的线性关系也不明显,并不适合使用协方差分析。本例为演示操作步骤和结果解读使用。
示例1 SPSS操作步骤与结果解读
【1】条件考察
(1)因变量与协变量的线性关系考察
Graphs>>ChartBuilder…
结果显示,不论Labe组还是Meto组,舒张压的基线值与治疗后结果线性关系并不明显,不适合使用线性模型来统计推断。注:本示例数据是通过Excel自动生成,没有任何实际意义。
实际上使用线性模型进行拟合的结果也显示,两组的基线值与治疗后的舒张压并不成线性关系,线性拟合步骤如下:
Analyze>>Regression>>Linear…
- Dependent(因变量):Dw13;
- Independent(自变量):Dbl;变量筛选方法(Method):Enter
- SelectionVariables(筛选变量):通过Rule筛选Group=1和Grou=2,分别进行两次线性拟合
主要结果:
Group=1:模型F=0.250,P=0.620;Dbl系数估计值-0.109,t=-0.500,P=0.620。
Group=2:模型F=0.190,P=0.666;Dbl系数估计值0.081,t=0.435,P=0.666。两个模型均只有一个自变量,系数检验和模型检验是一致的。
线性关系不成立是不能直接进行协方差分析的。为更好的演示操作,本例继续协方差进行分析的后续步骤。
(2)平行线假定检验:要检验治疗前和治疗后的舒张压的回归线是否平行,即治疗前舒张压对治疗后舒张压的影响在labe和meto两个组中是否相同,可用治疗前舒张压(Dbl)与治疗方法(Group)是否存在交互作用来表示。
Analyze>>GeneralLinear Model>>Univariate…
因变量:Dw13;固定因素:Group;协变量:Dbl
Model…对话框>>选择“Build Term”构建含有“Group、Dbl、Group*Dbl”的模型
其他默认选项
注:Model…对话框:全因素模型可以考察所有因素及其之间的交互作用,但各因素与协变量的交互作用不会输出,需要强行纳入处理因素和协变量的交互作用以进行分析,即group处于不同水平时,Dw13随Dbl变化的斜率是否相等。
结果显示:Group与Dbl的交互项无统计学意义(F=0.442,P=0.508),可以认为两组的斜率相同。