重复测量数据有几个明显的特征,一是个体内数据是反复收集的,同一对象的多次观测结果往往不独立(存在相关性),二是变异来源上看有个体内变异和个体间变异,三是数据可能存在缺失值。
有多个统计模型可以实现重复测量数据的分析:
【1】一般线性模型中的重复测量方差分析,可以采用一元方差分析和多元方差分析。重复测量方差分析要求还是比较苛刻的,要求多元正态性、组间方差-协方差矩阵相等(Box’M检验),数据上也不能有缺失值。一元差分析虽然考虑了个体随机效应,但要求方差协方差结构满足复合对称或者球性假设。复合对称结构假定不同时间点上的残差方差相等且协方差为常数,球形结构假设比复合对称结构假设要宽松一些,仅要求任意两时间点之差的方差相等。但真正满足这样的结构还是比较困难的,为了除去这种假设的不合理的影响,当数据不满足球性结构时就需要对结果进行校正,如Greenhouse-Geisser校正、Huynh-Feldt校正、Lower-bound校正。多元方差分析不对个体内的方差协方差结构做限定,只允许残差具有非结构方差协方差结构。【2】广义估计方程(GEE)。广义线性模型(GLM)是对一般线性模型的扩展,可以扩展到非正态数据,包括分类、计数资料等,广义方程估计在此基础上进一步扩展到可以处理非独立数据;【3】线性混合模型(LMM)。混合线性模型实际上是对方差分析模型的扩展,使其能够处理非独立数据;【4】广义线性混合模型(GLMM)。广义线性混合模型可以看做是广义线性模型和线性混合模型的融合,可以处理不呈正态也不独立的数据。
模型【1】【2】【3】前面都做过介绍: 重复测量的方差分析【SPSS】 、 重复测量的方差分析【JMP】 ; 广义估计方程 ; 多层线性混合模型【SPSS】 、 多层线性混合模型【STATA】 ,今天的示例是重复测量数据的广义线性混合模型【SPSS操作】。示例:某溶栓药物治疗20名急性脑梗死患者的疗效,采用随机、双盲、安慰剂平行对照设计,每组各10例,分别于治疗前及治疗后8周每周进行随访观测,观测指标为神经系统体征评分(MDNS)。示例来源:杨珉.李晓松等.医学和公共卫生研究常用多水平统计模型.北京:北京大学医学出版社,2007.5.
此案例我们在上次的stata笔记中用于建立演示多层线性混合效应模型的操作,笔记按部就班地从最简单地截距模型开始一直到最终模型的确立,但更多的只是演示步骤和结果解读,并不是对案例的完整分析,比如交互作用有意义之后的分层分析,连续变量的中心化处理等都未考虑。
加入背景协变量age后,结果会有校正。在组合模型里面,截距γ00是Trtgj=0