使用SAS，Stata，HLM，R，SPSS和Mplus的多层线性模型HLM

拓端研究室TRL

于 2022-12-13 23:45:45 发布

阅读量2.3k

点赞数 1

分类专栏：拓端数据拓端tecdat 拓端文章标签： r语言人工智能 python

本文链接：https://blog.csdn.net/tecdat/article/details/128309693

版权

该文比较了六种统计软件（SAS, Stata, HLM, R, SPSS 和 Mplus）在处理两级多层线性模型（HLM）时的过程和结果。通过不同模型（如仅截距模型，随机截距和斜率模型等）展示了各种软件的输出和特点。SAS, Stata, HLM, R 和 SPSS 的结果相近，而 Mplus 使用 ML 估计方法导致轻微差异。文章还讨论了类内相关系数（ICC）的计算和随机效应的处理。" 129728750,17285741,Java SSM 实现健身房管理网站毕设源码分享,"['Java', 'SSM框架', 'Mybatis', '数据库设计', '毕业设计']

摘要由CSDN通过智能技术生成

简介

最近我们被客户要求撰写关于多层线性模型的研究报告，包括一些图形和统计输出。本文档用于比较六个不同统计软件程序（SAS，Stata，HLM，R，SPSS和Mplus）的两级多层（也称分层或层次）线性模型的过程和输出。

下面介绍的六个模型都是两级分层模型的变体，也称为多级模型，这是混合模型的特殊情况。此比较仅对完全嵌套的数据有效（不适用于交叉或其他设计的数据，可以使用混合模型进行分析）。尽管HLM软件的网站声明可以用于交叉设计，但这尚未得到确认。下面的SAS，Stata，R，SPSS和Mplus中使用的过程是其多层次或混合模型过程的一部分，并且可以扩展为非嵌套数据。

但是出于比较的目的，我们将仅研究完全嵌套的数据集。除了HLM（完全由GUI运行）以外，所有程序的下面都包含用于每个模型的代码/语法。我们提供了HLM和SPSS的屏幕截图。此外，每个模型均以分层格式和混合格式指定。尽管模型的这两个表达式是等效的，但一些研究领域更倾向于可视化层次结构，因为它更容易看到层次之间的分离，而另一些研究领域则更喜欢混合格式，在其中容易区分固定效果和随机效果。

模型注意事项将预测变量添加到本文档讨论的六个模型中时，我们选择以均值居中为中心，这意味着我们从每个受试者的得分中减去了该变量的总体均值。

正如Enders＆Tofighi（2007）所详细讨论的那样，以总体平均值为中心，而不是以组平均值（每个组的平均值均以该组中受试者的得分为准）为中心，并不适合所有模型。。使用哪种居中方法的选择应由所询问的具体研究问题决定。另一个考虑因素是这些程序使用的估计方法来产生参数估计，即最大似然（ML）或受限最大似然（REML）。每种都有自己的优点和缺点。ML更适合不平衡的数据，但是会产生偏差的结果。REML是无偏的，但是在将两个嵌套模型与似然比检验进行比较时，不能使用REML。

两种方法将产生相同的固定效应估计，但它们对随机效应的估计却有所不同（Albright＆Marinova，2010）。正如我们将在下面讨论的模型中看到的那样，这两种方法产生的结果非常相似，并且不会极大地影响随机因素的p值。但是，重要的是要意识到，方法的选择会影响随机因素的估计，标准误差和p值，并且可能会影响宣布随机因素是否重要的决策。SAS，HLM，R和SPSS默认使用REML，而Stata和Mplus使用ML。在本文档中的Stata示例中，我们告诉Stata使用REML以便将输出与其他四个程序进行比较。

类内相关系数

我们还报告了每种模型的类内相关系数（ICC）ρ。ICC是结果变量中方差的比例，由分层模型的分组结构解释。它是根据组级别误差方差与总误差方差之比来计算的：

其中，是2级残差的方差，是1级残差的方差。换句话说，与总的无法解释的方差（方差之内和之间）相比，ICC报告了模型中任何可归因于分组变量的预测变量无法解释的变化量。

示例数据集

流行的数据集由来自不同班级的学生组成，并且由于每个学生都属于一个唯一的班级，因此它是一个嵌套设计。因变量是“流行”，它是一个自评的流行度，范围为0-10。预测指标包括学生级别的性别（二分法）和Extrav（连续的自我评价的外向得分），以及班级的Texp（多年的老师经验，是连续的）。

仅截距模型（无条件模型）

无条件混合模型规范类似于单因素方差分析，其总体均值和类效应。但是，我们将其视为随机效应（均值为零的正态分布变量），而不是像方差分析中那样的固定因子效应。因此，我们将估计值解释为每个类别的平均数在总体平均人气得分附近的方差。

估算值是每个班级的“大众”平均值的平均值，而不是研究中所有学生的平均值。如果数据完全平衡（即每个班级的学生人数相同），则无条件模型的结果将与方差分析程序的结果相同。

SAS结果

需要“ covtest”选项来报告方差分量估计的标准误差。另外，需要指定非结构化协方差矩阵类型，这是HLM和R默认情况下使用的类型，我们在这里使用它进行比较。SAS的输出等于Hox的书表2.1中的结果。我们可以得出结论，各类别之间的平均人气得分为5.078，并且各类别之间的差异（1.221）比不同类别之间的差异（0.702）多。当我们为该模型计算ICC时，将对此进行进一步讨论。

Stata结果

Stata的xtmixed命令需要因变量，后跟“ ||” 指定固定变量和随机变量之间的分隔。我们必须包括方差选项以查看输出中方差分量的估计值，以及reml选项以使用受限的最大似然估计。还要注意，Stata不会输出随机分量估计的p值，但是可以通过置信区间中是否包含零来确定有效值。这些结果与SAS的结果完全匹配