三、多水平模型
要了解多水平模型,得先了解多水平数据,或者叫多层次数据,简单来说就是具有一定层次结构的数据。比如学校-学生、村-村民、单位-职工,这些都是二层结构,同样,重复测量数据也是一个二层次数据,即:个人-时间点。每个人包含多个时间点,所以是个二层次结构数据。
多水平模型在不同领域有不同叫法,比如随机系数模型、随机效应模型、混合效应模型等等,其实说的都是差不多一回事。它主要是一种处理非独立数据的方法(重复测量数据就是非独立数据,因为每次测量结果可能是相关的,而不是独立的)。
多水平模型应用场景很多,这里只介绍它在重复测量数据中的应用情况。对于重复测量数据,它是将个体与时间点分别看做水平2和水平1两个层次上的数据,水平2包含水平1(即每个人包含多次测量)。
(一)基于重复测量数据的多水平模型思想
对于重复测量数据,传统方法(如一般线性模型)的做法是将数据合并,估计自变量(如组别因素、时间)的效应,这种做法忽略了个体间的变异,因为它假定个体之间是没有差异的。而现实情况是,数据的差异不仅体现在个体内(不同时间点),往往个体之间也是有差异的,因此分析时需要考虑到个体间的差异。
多水平模型正是基于这种思想,将个体间(水平2)的变异分解出来,并估计其大小(通常用方差表示)。然后在此基础上,再估计自变量(如组别)的效应。
(二)多水平模型中的随机效应
多水平模型中,随机效应是一个非常关键的词。多水平模型不同于传统方法的特点就是可以估计随机效应。
在重复测量数据中,随机效应可以理解为个体(水平2)间的随机差异。常见的随机效应有两类:
一是个体间只有截距存在差异,斜率相同(图2左,表现为几条平行曲线或直线),即每一个体高低不同,但时间变化趋势相同,这时候如何体现个体间(水平2)的差异呢?只要估计出截距的变异(方差)就行了,所以这种情况下叫做随机截距模型;
二是个体间不仅截距存在差异,斜率也不相同(图2右,表现为几条不平行的曲线或直线),即每一个体不仅高低不同,而且每个人随时间变化的趋势也各不相同。这种情况下,要体现出个体间的差异,仅估计截距的变异是不够,还得估计斜率的变异,即随机系数模型。
重复测量数据分析中,通常先考虑随机截距模型,如果出于专业需要,或经图形发现每个人的时间变化趋势差别较大,也可以考虑随机系数模型。