在做回归时,很多时候会有 E ( x t ε t ) ≠ 0 \text{E}(x_t \varepsilon_t)\neq 0 E(xtεt)=0的情况,这也意味着不满足外生性条件 E ( ε ∣ X ) = 0 \text{E}(\varepsilon|X)=0 E(ε∣X)=0,此时的OLS估计量 β ^ \hat\beta β^就不再满足无偏性,并且随着 n n n的变大,它的bias也无法变小。若对此无法理解,请先掌握《小样本OLS回归梳理》中的内容。
此时该怎么办?一种解决方法是利用一些与 ε \varepsilon ε无关的变量,这就是工具变量(instrumental variables,下文统称IV)。我们假设找到的IV是一些 l × 1 l\times 1 l×1的向量 z t z_t zt,再将它排成 n × l n\times l n×l的矩阵 Z = [ z 1 , ⋯ , z n ] ′ Z=[z_1,\cdots,z_n]' Z=[z1,⋯,zn]′。
IV需要与原来的 x t x_t xt足够接近,因此 Z ′ X Z'X Z′X( X X X为 n × k n\times k n×k矩阵)必须满列秩。而我们寻找IV的目的,就是要让IV满足 E ( z t ε t ) = 0 \text{E}(z_t\varepsilon_t)=0 E(ztεt)=0,由数据生成过程 ε t = y t − x t ′ β o \varepsilon_t=y_t-x'_t\beta_o εt=yt−xt′βo可知,我们要求解的就是满足 E ( z t ( y t − x t ′ β o ) ) = 0 \text{E}(z_t(y_t-x'_t\beta_o))=0 E(zt(yt−xt′βo))=0的 β o \beta_o β