原文链接:https://www.lianxh.cn/news/77d0128e722e7.html
[source]: Hünermund P, Louw B. On the Nuisance of Control Variables in Regression Analysis[J]. arXiv preprint arXiv:2005.10314, 2020. -Link-
目录
在回归分析中,我们经常会引入「控制变量」来更好的评估自变量和因变量之间的因果关系。在这篇文章中,我们认为控制变量本身是不具有因果解释的。因此,我们建议在实证研究论文的结果部分「不要讨论其边际效应」。
1. 引言
多元回归分析 (multivariate regression) 是战略管理和经济学实证研究中的重要工具。这种方法通过引入控制变量来缓解混杂变量对因果效应估计的干扰。尽管控制变量在因果推断中处在一个很重要的地位,但在实证研究中,学者经常夸大其作用。
在本文中,我们认为:虽然控制变量对于因果关系的识别至关重要,但其本身通常不具有结构性解释。即使是有效的控制变量,也常常会与其他未观察到 (或不能观测到) 的因素(unobserved factors)关联,从因果推断的角度来看,这使得它们的边际效应无法解释 (Westreich 和 Greenland,2013; Keele等,2020)。因此,研究人员应考虑在解释其分析结果时完全忽略它们。
然而,在研究中,从控制变量中得出实质性结论的现象很普遍,例如,「控制变量的影响符合预期」 、「在结果中,我们的控制变量的结果值得注意」 等表述。具体来看,我们对近五年来在 Strategic Management Journal 上使用参数回归模型的论文进行了分析,发现有近 47% 的文章明确讨论了控制变量的估计效果。
此外,审稿人也经常会以「尽管这些控制变量并不是分析的主要重点,但他们仍然可以提供有价值的信息」为依据,要求论文作者提供控制变量系数的经济解释的情况。