R数据分析:混合效应模型的可视化解释,再不懂就真没办法

74 篇文章 350 订阅

 

好多同学咨询我混合效应模型,有些问题自己需要讲很多遍,想想就再开一贴,争取这一篇文章给大家写清楚。

混合效应模型名字很多,Hierarchical Modeling, also known as Mixed Effects Modeling,有叫分层模型的,分层回归的,随机模型的等等,你要知道它都是指的是一个东西。

这个东西就是用来分析嵌套数据的!---------nested data

嵌套数据

这个时候有人就问,啥是嵌套数据啊?

These are instances in which each observation is a member of a group, and you believe that group membership has an important effect on your outcome of interest.

嵌套数据就是套着的数据,你就这么理解,就是比如说我要分析学生学习对收入的影响,我调查了好多学校,我是不是可以很有理由的认为学校水平上的特征也会影响学生收入?

这个时候学生就是嵌套在学校水平上的。

再来一个例子,比如我要调查焦虑和抑郁的关系,我调查了30个人,每个人调查了5次,我得到了150个数据,那么这些数据是不是嵌套在个人水平上的?

理解没?

还没有,好吧,继续

我们收集的数据先做个散点图:

R数据分析:混合效应模型的可视化解释,再不懂就真没办法

 

我们假设上面的数据是员工的收入数据,横轴是工作年限,纵轴是收入,我调查了整个公司的员工,员工分布在不同部门吧,我说部门的不同会影响员工收入没问题吧,上图中颜色不同代表部门不同。

其实数据就是嵌套的,它是这样的:

R数据分析:混合效应模型的可视化解释,再不懂就真没办法

 

每个人嵌套在不同部门种,好,现在你要看收入和工作时间的关系,你如果不考虑嵌套,会怎么做?

是不是你直接做个以工作时间为自变量,以收入为因变量的回归?

做出来就长这样:

R数据分析:混合效应模型的可视化解释,再不懂就真没办法

 

看着还行?

错!

你这个系数根本就不准,你没有考虑嵌套,没有考虑部门间也就是更高水平的变异!

混合效应模型

那么,告诉我到底怎么做嘛,

接着看,你肯定听过随机斜率和随机截距。

我们一个个来看,我刚刚说了你没有考虑更高水平的变异,那么这个变异情况有什么可能,你自己想嘛,是不是有可能部门间的起薪不一样?有可能部门间薪资增长率不一样?或者两个都不一样嘛。

那么随机截距就是描述不同部门起薪的,加上随机截距就意味着我们认为不同的部门起薪不一样,可以变化,这个时候就是有随机截距的混合效应模型:

R数据分析:混合效应模型的可视化解释,再不懂就真没办法

 

在上面的描述中,个体水平上斜率是一定的,是固定效应,部门水平上可以有不同的起薪,是随机效应。

再看随机斜率,

就是说,有可能员工起薪都一样只是薪资增长斜率在不同部门不一样,要拟合这样一个混合效应模型我们就要给模型的高水平,也就是部门水平加上随机斜率:

R数据分析:混合效应模型的可视化解释,再不懂就真没办法

 

此时我们的模型可以拟合不同部门的斜率,这个叫做随机斜率模型。此时我们认为,个人薪资受到个人水平上的工作年限的影响和不同部门薪资增长的影响,工作年限是主效应,部门薪资增长是随机效应。

但是我们看到,对于我们这个例子来说,只有随机斜率似乎不太理想。

继续看,

随机斜率+随机截距

也就是说更合理的情况就是每个部门的起薪和每个部门的薪资增长都是不一样的,这种情况就是随机截距+随机斜率:

R数据分析:混合效应模型的可视化解释,再不懂就真没办法

 

这种情况下,我们就认为每个人的薪资受到部门起薪的影响,还受到部门薪资增长的影响,此时工作年限是主效应,部门起薪,部门薪资增长都是随机效应。

如何选择

你明白上面三种模型后,又出现问题了

那我咋知道我到底该加随机截距还是随机斜率啊

问的好,此时要么你就更具理论经验,比如我就确定部门起薪就是一样的,那我就只加随机斜率;还有你可以一个一个试错,因为模型拟合出来都有拟合优度指数,你去看哪个模型的拟合优度最好你就选哪个。

小结

今天给大家写了混合效应模型的不同类型,至于具体如何做,请看我之前的文章。感谢大家耐心看完,自己的文章都写的很细,代码都在原文中,希望大家都可以自己做一做,请关注后私信回复“数据链接”获取所有数据和本人收集的学习资料。如果对您有用请先收藏,再点赞转发。

也欢迎大家的意见和建议。

如果你是一个大学本科生或研究生,如果你正在因为你的统计作业、数据分析、论文、报告、考试等发愁,如果你在使用SPSS,R,Python,Mplus, Excel中遇到任何问题,都可以联系我。因为我可以给您提供好的,详细和耐心的数据分析服务。

如果你对Z检验,t检验,方差分析,多元方差分析,回归,卡方检验,相关,多水平模型,结构方程模型,中介调节,量表信效度等等统计技巧有任何问题,请私信我,获取详细和耐心的指导。

If you are a student and you are worried about you statistical #Assignments, #Data #Analysis, #Thesis, #reports, #composing, #Quizzes, Exams.. And if you are facing problem in #SPSS, #R-Programming, #Excel, Mplus, then contact me. Because I could provide you the best services for your Data Analysis.

Are you confused with statistical Techniques like z-test, t-test, ANOVA, MANOVA, Regression, Logistic Regression, Chi-Square, Correlation, Association, SEM, multilevel model, mediation and moderation etc. for your Data Analysis...??

Then Contact Me. I will solve your Problem...

加油吧,打工人!

猜你喜欢

R数据分析:混合效应模型实例

从“我丑到我自己了”说起——混合效应模型续

重复测量数据分析系列:混合效应模型基础

R数据分析:如何计算问卷的聚合效度,实例操练

R数据分析:如何计算问卷的组合信度,实例操练

  • 39
    点赞
  • 138
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
《python数据分析:基于plotly的动态可视化绘图.pdf》是一本关于使用Python进行数据分析的书籍,主要介绍了如何利用plotly库进行动态可视化绘图。 数据分析是通过收集、清洗、加工、分析和呈现大量数据来揭示其中潜在规律和洞察的过程。而可视化则是将数据以图表等可视化方式展示,帮助我们更直观地理解和解读数据。plotly是Python中一款功能强大的可视化库,它可以生成各种交互式图表,支持动态可视化和在线展示。 《python数据分析:基于plotly的动态可视化绘图.pdf》通过实例演示了如何使用plotly库进行数据分析中常用的可视化操作,包括折线图、柱状图、散点图、饼图、地理图等。使用plotly库可以轻松创建动态可视化图表,通过调整参数和设置动画效果,可以让图表更生动、更具吸引力。 动态可视化是一种通过动态变化的图表来展示数据的方法。它可以帮助我们更好地理解数据的变化趋势和规律,发现数据中隐藏的特征和模式。在数据分析中,动态可视化常用于时间序列数据、实时数据等领域,能够直观地展示数据的变化过程和动态趋势。 综上所述,《python数据分析:基于plotly的动态可视化绘图.pdf》是一本介绍如何使用plotly库进行动态可视化绘图的书籍,通过实例演示了使用plotly库创建各种动态可视化图表的方法和技巧,对于对数据分析可视化有兴趣的人来说,是一本不可多得的学习资料。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

公众号Codewar原创作者

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值