目录
1. 问题简介
在经历数据收集、清洗、回归分析之后,我们终于拿到了朝思暮想的回归结果,但是马上会遇到一个新的问题:如何解读回归结果中的系数?
如果足够幸运 (当然通常都没有这么幸运),我们能够用一个简单回归模型分析感兴趣的问题。例如,在模型 (1) 的回归结果中,回归系数估计值 的含义是相当明显的: 变化一个单位对 造成的影响。
但是在更普遍的情形下,单变量回归模型的解释力往往是不足的,因此我们需要在回归模型中加入一系列控制变量。为了保持讨论的简洁性,我们主要考虑模型两个解释变量的情况。在回归模型 (2) 中, 的含义就更加复杂:在控制 不变的条件下, 变化一个单位对 造成的影响。
上述两个模型中 系数含义的主要区别是:模型 (2) 强调对回归方程中另一个解释变量 的控制,但是模型 (1) 没有控制其他因素。在文章中写下“在控制了其他因素之后,本文发现……”是没有什么难度的,真正的问题是:当我们宣称自己控制了其他因素的时候,我们在表达什么?