一:关于DID
DID即diff in diff,
DID主要应用场景是:研究某项政策或策略实施后是否有效果;涉及时间前后某经济指标的比较,即存在时间维度的比较;
DID应用的局限性: 首先是对数据的要求,可以获得政策执行前的数据以及政策执行后的数据;其次要求可以找到好的对照组(即除了是否实施该政策有有差异外,其余的个体差异应当控制住并保持不变)
DID易错:关于核心的解释变量是“时间t”还是 “是否执行政策treat”呢?由于我们研究的对象是 “这项政策执行后是否有效果”,主要针对政策执行前后是否要显著差异,因此我们的核心解释变量是t而不是是否实施这项政策treat。
DID基本程序:
cd "D:\stata15\data\practice\cause and effect data"
log using"D:\stata15\log\PSM and DID.log",replace
use cardkrueger1994.dta,clear
des
*对数据的描述
//研究提高最低工资标准后对雇佣数量的影响;
//treated即是否实施了提高工资标准,1代表实施,即新泽西州;0代表未实施,即宾夕法尼亚州;
//研究政策实施前后的雇佣数量的变化,t对比1992年2月的雇佣数量和1992年11月的差异;
//fte即y,雇佣数量;bk kfc roys wendys都是控制变量
gen gd=t*treated //生成交互项
reg fte gd treated t,r
diff fte,treat(tr