本文为简明PSM-DID教程,适合初学者。本文首先简述PSM和DID的原理,最后讲如何实际操作,附有stata代码。
内容链接:实证方法:倾向值匹配+双重差分(PSM-DID) - SSSDBK
一、为什么要进行倾向值匹配?
反事实理论框架
二、倾向值匹配的步骤
(一)选择协变量
(二)估计倾向值
(三)根据倾向值进行匹配
三、PSM-DID
(一)双重差分
(二)倾向值匹配双重差分
四、PSM-DID的STATA实现
1.如果是第一次使用psmatch2命令,需要在stata中输入以下代码进行安装。
ssc install psmatch2, replace
2.之后进行倾向值匹配,代码如下。获得的结果可以根据相关论文进行取舍。
use 数据, clear //使用处理过的数据
global xlist "x1 x2 x3 x4 x5" //选择的协变量
psmatch2 x $xlist , outcome(y) logit ate common ties //x为自变量是否上过大学,y为因变量薪资,使用最近邻匹配
3.进行psmatch2之后我们可以得到三部分结果。分别为:
- 第一部分:logit回归结果。
- 第二部分:ATT,ATU和ATE的值。我们主要关注ATT的t-stat,只要t的绝对值大于1.64即可说明匹配结果显著。
- 第三部分:报告两组在共同取值范围内的样本量。一般论文不展示此结果。
4.进行平衡性检验。
pstest $xlist, both graph //平衡性检验,并获得匹配质量图
此处结果主要参考匹配前后的%bias是否大幅下降,以及%reduct|bia|的大小(一般来说越接近100%表示匹配质量越好)
5.双重差分
gen treated = x
gen time = (year>=1999) //政策实施后为1,实施前为0
gen did = time * treated
xtreg y time treated did , fe //不包含控制变量
xtreg y time treated did $xlist , fe //包含控制变量