虚拟变量与双重差分
虚拟变量的模型设定
首先我们先对解释变量中的定性因素和定量因素作以下阐述:
定量因素:可直接测度、数值性的因素;
定性因素:属性因素,表征某种属性存在与否的非数值性的因素。
在实际建模中,如何对定性因素进行回归分析?采用“虚拟变量”对定性变量进行量化是最常用的一种思路。其基本思想为:
直接在回归模型中加入定性因素存在诸多的困难;
可将这些定性因素进行量化,以达到定性因素能与定量因素有着相同作用之目的;
有些定量因素也可以采取分组的方式来研究。
虚拟变量设置的时候需要考虑以下的基本规则:
总原则为:设置能够区分所有属性的最少虚拟变量。
虚拟变量取“1”或“0”的原则,应从分析问题的目的出发予以界定。从理论上讲,虚拟变量取“0”值通常代表比较的基础类型;而虚拟变量取“1”值通常代表被比较的类型。
如果定性因素具有 \(m\) 个相互排斥属性,当模型中含有截距项时,则只能引入 \(m-1\) 个虚拟变量;当模型中没有截距项时,则可以引入 \(m\) 个虚拟变量,否则就会陷入“虚拟变量陷阱”。
“虚拟变量陷阱”的实质:完全共线性。
虚拟变量的回归分析
在计量经济学中,通常引入虚拟变量的方式分为加法方式和乘法方式两种。
加法方式:
\[Y_i=\alpha_0+\beta_1X_i+u_i+\alpha_1 D_i \ .
\]
乘法方式:
\[Y_i=\alpha_0+\beta_1X_i+u_i+\beta_2X_iD_i \ .
\]
实质上,加法方式引入虚拟变量改变的是截距,乘法方式引入虚拟变量改变的是斜率。
含有虚拟变量的模型的分析手段:条件期望。
以加法方式引入虚拟变量时,主要考虑的问题是定性因素的属性和引入虚拟变量的个数。主要有四种情况:
解释变量只有一个定性变量而无定量变量,而且定性变量为两种相互排斥的属性;
解释变量分别为一个两种属性的定性变量和一个定量变量;
解释变量分别为一个定性变量