原文链接:中介变量和调节变量分析https://mp.weixin.qq.com/s/CdP2fm7rZyKlcrXmWw-0MA中介变量和调节变量都与回归分析有关,可以通过逐步回归来分析。
中介效应分为完全中介和部分中介。完全中介是指中介变量M控制后(保持不变),自变量X的直接效应就没有了,相当于水流全都要经过M再到达Y;而部分中介在此种情况下,X的效应只是减弱了,但不是完全消失,相当于还存在X到Y的流通管道。
调节变量指出自变量在何种情况下会影响到因变量,它为变量之间的关系提供情境性的解释。调节要回答的问题是自变量X和因变量Y两者的关系在什么样的条件下是成立的,调节变量可以加强、减弱,甚至反转X和Y之间的关系。
我们先来看一张经典的中介变量路径图[1]。示意图默认所有变量为连续型变量,并对所有变量事先做中心化处理(减少非本质的多重共线性[5])。
回归方程如下:
传统方法确定中介效应有两个前提条件。其一,式子(1)中系数c显著不为0,c表示X对Y的总效应;其二,式子(2)中系数a显著不为0,且式子(3)中系数b也显著不为0。接着判断c'是否显著不为0,如是:则c'是X对Y的直接效应(间接效应等于a*b),如不是:则称之为完全的中介过程(c'的路径就不存在了)。
第二种方法是把式子(2)代入式子(3)中,得到如下方程:
此时,只要检验式子(4.1)中系数ab是否显著不为0,后面实例探究里使用的就是这个方法。
调节变量可以是定性的(如性别),也可以是定量的(连续变量)。在做调节效应分析时,同样要将自变量和调节变量做中心化转换。最常见的调节模型方程如下:
Y = aX + bM + cXM + e
上式重写后变成:
Y = bM + ( a + cM )X + e
要是M是固定的(如:1或0),便是Y对X的直线回归,它俩的关系由回归系数( a + cM )来刻画,其中c衡量了调节效应的大小,示意图如下[6]。
对模型中调节效应的分析主要是估计并验证系数c,如果显著,意味着c为0的假设被拒绝了,也即说明M的调节效应是显著的。不过此处的系数c也代表着X和M之间的交互效应,因此从统计分析的角度看,调节效应和交互效应是等价的。不过两者在概念上还是存在很大的不同。
交互效应中,两个自变量的地位可以是对等的,即两者之一都可以解释为调节变量;也可以是不对等的,只需其中一个起到调节变量的作用,就存在交互效应。但在调节效应模型中,自变量和调节变量是明确的,要是相互对换后,原先的假设就不一定成立(例如:要研究数学能力的性别差异,年级是调节变量;因为各年级的试题不一样,所以把年级切换成自变量是不合适的)。
对于可直接观测的显变量(相比于潜变量),下表列出了调节效应的分析方法[6]。当(1)自变量和调节变量都是类别变量时,做方差分析即可;当(2)两者都是连续变量时,用带有乘积项的回归方程做层次回归分析,查看带乘积项回归方程的R2是否显著高于原先方程的R2;当(3)调节变量为类别类型、自变量为连续类型时,方法之一是做分组回归分析,查看回归系数的差异是否显著;当(4)自变量是类别型、调节变量是连续型,需要将自变量重新编码成虚拟变量(dummy variable),分析方法同(2)。
要是中介变量和调节变量一同分析,可分为(1)可调节的中介模型和(2)被中介的调节模型。模型(1)的重心是中介模型,被调节后得到不同情境下的效应量,所以先是验证中介效应再来验证调节效应。模型图如下[4],其中显示调节变量Z调节了三条路径,不过只要存在一条调节路径模型就成立。
模型(2)首先是一个调节模型,然后这个调节效应在中介路径上也存在,如下图所示(Mo表示调节变量、Me表示中介变量)[3],所以验证顺序先是调节效应再是中介效应。
【实例探究】
我们使用bruceR包中的PROCESS()函数来进行各种中介效应和调节效应的分析。其内部使用mediation包进行中介效应分析、interactions包进行调节效应和简单斜率分析,而有调节的中介模型同时使用了mediation和interactions这两个包。例子演示我们用到mediation包里的student数据集,其中包含17列变量和近万条数据,主要变量说明如下。
SCH_ID: 学校ID;
fight: 学校打架指标,1表示打架;
attachment: 学校依恋指标,1表示喜欢;
work: 兼职工作指标,1表示有;
smorale: 学校士气,共有4个水平;
free: 十年级学生接受免费午餐的百分比,共有7个水平;
score: 数学成绩;
late: 学生上学迟到次数,共有5个水平;
gender: 性别指标,1表示女性;
income: 家庭总收入,共有13个水平;
pared: 父母受教育程度,共8个水平。
1.调节效应分析
1.1 数学分数与迟到次数两者间的关系(性别作为调节变量)
data=mediation::student %>%
dplyr::select(SCH_ID, free, smorale, pared, income,
gender, work, attachment, fight, late, score)
# 将性别变量转化为因子类型
data$gender=factor(data$gender, levels=1:0, labels=c("Female", "Male"))
PROCESS(data, y="score", x="late", mods="gender")
在PART 1部分,我们看到红框部分模型系数c是显著的(见下图),即说明性别的调节作用是成立的,PART 2部分交互作用的显著性也印证了这个结论。最后部分显示,分组简单斜率的系数都是显著的,表明数学成绩与迟到次数的负相关在男女生中都存在。
1.2 数学分数与性别两者间的关系(迟到次数作为调节变量)
此时调节变量是连续变量,默认是取平均值和上下一个标准差来做简单斜率分析(见下图最后部分)。
PROCESS(data, y="score", x="gender", mods="late")
2.中介效应分析
PROCESS(data, y="score", x="pared", meds="income", covs="gender",
ci="boot", nsim=1000, seed=1234)
meds指示中介变量,covs指示协变量(即控制变量)。
ci指示间接效应的标准误(SE)和95%置信区间(CI)的估计方法;对于(广义的)线性模型默认为"boot",对于(广义的)线性混合模型(即多层模型)默认为"mcmc"。
nsim指示用于估计SE和95% CI的模拟样本数量(bootstrap重采样或蒙特卡罗模拟);默认值为100,在正式分析中,强烈建议设置为1000以上。
seed指示随机种子,以获得可重复的结果(默认为空)。
上图显示,总效应等于间接效应和直接效应之和,即c = c’ + ab。由于ab显著不为0,因此原有假设成立,即数学成绩受到父母受教育程度的影响,并且家庭总收入是作为中介变量存在的。
3.有调节的中介效应分析
PROCESS(data, y="score", x="fight", meds="late", mods="gender",
mod.path=c("x-m", "x-y"), ci="boot", nsim=1000, seed=1234)
mod.path指示调节变量会影响哪些路径?可以是"x-y"、"x-m"或"m-y",以及它们的任意组合(使用c()函数)或"all"(即所有路径)。
在PART 1部分,蓝框部分表明X到M的调节作用是不显著的,红框部分表明X到Y的调节效应是存在的,PART2部分的交互效应印证了这两点。最后部分的间接效应[ab]表明,不论是男生或是女生,中介模型都是成立的。
参考文章:
- 解答关于中介变量和中介效应的一些问题
https://zhuanlan.zhihu.com/p/160262846 - bruceR包v0.7.0:PROCESS()函数轻松实现中介效应和调节效应分析
https://zhuanlan.zhihu.com/p/376007591 - 干货|还不了解中介调节模型?赶紧收藏本文吧!
https://baijiahao.baidu.com/s?id=1737705824417673227&wfr=spider - 在R中实现有调节的中介模型(显变量)
https://zhuanlan.zhihu.com/p/67003105 - 调节效应分析时,为何要进行中心化处理?
https://new.qq.com/rain/a/20220403A075EN00 - 控制变量、调节变量和中介变量的区别与联系
https://general.medsci.cn/article/show_article.do?id=3cd9e3682338