2019金秋十月-空间计量专题班,杨海生主讲,成都
实证研究之初,研究者通常希望可以直观得观察变量 y 与 x 的关系,并以此做出最初关于二者相关关系的基本预判。一个常用的命令是 twoway scatter
。该命令允许绘制 y 与 x 的散点图,借此研究者可以对二者关系产生较为直观的认识。然而,这种方式只能非常 粗糙 地描述二者的关系。其原因在于并没有控制其他变量的影响。
计量经济学中,我们认为其粗糙的原因在于遗漏变量偏差 (omitted variable bias)。在尚未控制其他变量影响的情况下,研究者无法断言两个变量相关性的存在,也无法进行量化分析。
而本篇推文介绍的命令 avplot
avciplot
,xtavplot
则基于部分回归 (partial regression) 的计量原理,在控制了其他变量影响的情况下,允许研究者绘制部分回归图,观测变量 y 与 x 的关系。
1. 部分回归:Frisch-Waugh Theorem
部分回归的基本思想是,当引入控制变量后,若想探究解释变量 x1 与被解释变量 y 的相关系数,那么就先 剔除 (partial out) 控制变量对 y 的影响和 剔除 控制变量对 x1 的影响,之后再让剩余部分的 y 对剩余部分的 x1 做回归。
1.1 计量原理
具体而言,假设线性回归方程为
y = X β + ε \mathrm{y}=\mathrm{X} \beta+\varepsilon y=Xβ+ε
β \beta β 为 K × 1 K \times 1 K×1 的系数向量, ϵ \epsilon ϵ 为 $n \times 1 $ 的残差向量。
OLS 估计量 b b b 满足下式
X ′ X b = X ′ y X'Xb = X'y X′Xb=X′y
X X X 可以被分割为 $ X = [x_1, X2]$,其中 X 2 = [ x 2 , . . . , x k ] X_2 = [x_2, ..., x_k] X2=[x2,...,xk]。将 X X X 分割后, X ′ X X'X X′X 可以进一步表示为
(1) [ x 1 ′ x 1 x 1 ′ X 2 X 2 ′ x 1 X 2 ′ X 2 ] \left[ \begin{matrix} x_1'x_1 & x_1'X_2 \\ X_2'x_1 & X_2'X_2 \end{matrix} \tag{1} \right] [x1′x1X2′x1x1′X2X2′X2](1)
X ′ y X' y X′y 则可进一步表示为
(2) [ X 1 ′ y X 2 ′ y ] \left[ \begin{matrix} X_1'y \\ X_2'y \end{matrix} \tag{2} \right] [X1′yX2′y