left join 一对多 数据重复_重复测量数据分析及结果详解(之三)——多水平模型...

本文详细介绍了多水平模型在处理重复测量数据中的应用,解释了随机效应和多水平模型的思想,强调了个体间差异的重要性。通过SAS软件的示例,展示了如何分析数据并确定使用随机截距模型或随机系数模型。最后提到了模型选择和时间变量的处理策略。
摘要由CSDN通过智能技术生成
上一篇文章继续 介绍了基于重复测量数据的广义估计方程,对广义估计方程的结果进行了详细解释 。本文承接上文,继续介绍医学中重复测量数据的常用方法:多水平模型(multilevel model)。

三、多水平模型

dfa37f794bf800a0e340fd004bc5d3f0.png

要了解多水平模型,得先了解多水平数据,或者叫多层次数据,简单来说就是具有一定层次结构的数据。比如学校-学生、村-村民、单位-职工,这些都是二层结构,同样,重复测量数据也是一个二层次数据,即:个人-时间点。每个人包含多个时间点,所以是个二层次结构数据。

多水平模型在不同领域有不同叫法,比如随机系数模型、随机效应模型、混合效应模型等等,其实说的都是差不多一回事。它主要是一种处理非独立数据的方法(重复测量数据就是非独立数据,因为每次测量结果可能是相关的,而不是独立的)。

多水平模型应用场景很多,这里只介绍它在重复测量数据中的应用情况。对于重复测量数据,它是将个体与时间点分别看做水平2和水平1两个层次上的数据,水平2包含水平1(即每个人包含多次测量)。

(一)基于重复测量数据的多水平模型思想

对于重复测量数据,传统方法(如一般线性模型)的做法是将数据合并,估计自变量(如组别因素、时间)的效应,这种做法忽略了个体间的变异,因为它假定个体之间是没有差异的。而现实情况是,数据的差异不仅体现在个体内(不同时间点),往往个体之间也是有差异的,因此分析时需要考虑到个体间的差异。

多水平模型正是基于这种思想,将个体间(水平2)的变异分解出来,并估计其大小(通常用方差表示)。然后在此基础上,再估计自变量(如组别)的效应。

(二)多水平模型中的随机效应

多水平模型中,随机效应是一个非常关键的词。多水平模型不同于传统方法的特点就是可以估计随机效应。

在重复测量数据中,随机效应可以理解为个体(水平2)间的随机差异。常见的随机效应有两类:

一是个体间只有截距存在差异,斜率相同(图2左,表现为几条平行曲线或直线),即每一个体高低不同,但时间变化趋势相同,这时候如何体现个体间(水平2)的差异呢?只要估计出截距的变异(方差)就行了,所以这种情况下叫做随机截距模型;

二是个体间不仅截距存在差异,斜率也不相同(图2右,表现为几条不平行的曲线或直线),即每一个体不仅高低不同,而且每个人随时间变化的趋势也各不相同。这种情况下,要体现出个体间的差异,仅估计截距的变异是不够,还得估计斜率的变异,即随机系数模型。

重复测量数据分析中,通常先考虑随机截距模型,如果出于专业需要,或经图形发现每个人的时间变化趋势差别较大,也可以考虑随机系数模型。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值