left join 一对多数据重复_重复测量数据分析及结果详解（之三）——多水平模型...

最新推荐文章于 2023-08-03 16:55:20 发布

weixin_39912368

最新推荐文章于 2023-08-03 16:55:20 发布

阅读量958

点赞数 1

文章标签： left join 一对多数据重复

本文链接：https://blog.csdn.net/weixin_39912368/article/details/113085999

版权

本文详细介绍了多水平模型在处理重复测量数据中的应用，解释了随机效应和多水平模型的思想，强调了个体间差异的重要性。通过SAS软件的示例，展示了如何分析数据并确定使用随机截距模型或随机系数模型。最后提到了模型选择和时间变量的处理策略。

摘要由CSDN通过智能技术生成

上一篇文章继续介绍了基于重复测量数据的广义估计方程，对广义估计方程的结果进行了详细解释。本文承接上文，继续介绍医学中重复测量数据的常用方法：多水平模型(multilevel model)。

三、多水平模型

要了解多水平模型，得先了解多水平数据，或者叫多层次数据，简单来说就是具有一定层次结构的数据。比如学校-学生、村-村民、单位-职工，这些都是二层结构，同样，重复测量数据也是一个二层次数据，即：个人-时间点。每个人包含多个时间点，所以是个二层次结构数据。

多水平模型在不同领域有不同叫法，比如随机系数模型、随机效应模型、混合效应模型等等，其实说的都是差不多一回事。它主要是一种处理非独立数据的方法(重复测量数据就是非独立数据，因为每次测量结果可能是相关的，而不是独立的)。

多水平模型应用场景很多，这里只介绍它在重复测量数据中的应用情况。对于重复测量数据，它是将个体与时间点分别看做水平2和水平1两个层次上的数据，水平2包含水平1(即每个人包含多次测量)。

(一)基于重复测量数据的多水平模型思想

对于重复测量数据，传统方法(如一般线性模型)的做法是将数据合并，估计自变量(如组别因素、时间)的效应，这种做法忽略了个体间的变异，因为它假定个体之间是没有差异的。而现实情况是，数据的差异不仅体现在个体内(不同时间点)，往往个体之间也是有差异的，因此分析时需要考虑到个体间的差异。

多水平模型正是基于这种思想，将个体间(水平2)的变异分解出来，并估计其大小(通常用方差表示)。然后在此基础上，再估计自变量(如组别)的效应。

(二)多水平模型中的随机效应

多水平模型中，随机效应是一个非常关键的词。多水平模型不同于传统方法的特点就是可以估计随机效应。

在重复测量数据中，随机效应可以理解为个体(水平2)间的随机差异。常见的随机效应有两类：

一是个体间只有截距存在差异，斜率相同(图2左，表现为几条平行曲线或直线)，即每一个体高低不同，但时间变化趋势相同，这时候如何体现个体间(水平2)的差异呢？只要估计出截距的变异(方差)就行了，所以这种情况下叫做随机截距模型；

二是个体间不仅截距存在差异，斜率也不相同(图2右，表现为几条不平行的曲线或直线)，即每一个体不仅高低不同，而且每个人随时间变化的趋势也各不相同。这种情况下，要体现出个体间的差异，仅估计截距的变异是不够，还得估计斜率的变异，即随机系数模型。

重复测量数据分析中，通常先考虑随机截距模型，如果出于专业需要，或经图形发现每个人的时间变化趋势差别较大，也可以考虑随机系数模型。

关注

left join 一对多 数据重复_重复测量数据分析及结果详解（之三）——多水平模型...