双重差分
基础简介
用于测量政策实施后的效果。
常用于评估随机试验和自然实验(法律、法规的调整)。因为实验的效果常常需要一段时间才会显现,因此我们需要实验前后几年的数据来评估被解释变量试验前后的变化。
优点:
- 可以解决内生性影响
- 政策对于微观经济主体而言是外生的,不存在逆向因果问题。
- 固体效应也在一定程度上缓解了遗漏变量问题
- 更加科学,可以更准确的估计出政策效应
- 原理和模型简单
- 时尚
缺点:仅仅可以用于面板数据
数据需要满足的两个条件
-
两组样本:实验组和对照组
-
两个时期:政策实施前,政策实施后
除此之外,实验组和对照组在实验前要有共同的趋势,而且需要有一定的政策效应。
理论模型
基准模型
Y i t = α 0 + α 1 d u + α 2 d t + α 3 d u ∗ d t + ε i t ( i = 1 , . . . n ; t = 1 , 2 ) Y_{it} =\alpha_0 + \alpha_1du +\alpha_2dt +\alpha_3du*dt+\varepsilon_{it} (i=1,...n;t=1,2) Yit=α0+α1du+α2dt+α3du∗dt+εit(i=1,...n;t=1,2)
d u du du为分组虚拟变量,如果个体i属于实验组, d u = 1 du=1 du=1,同理,如果个体i属于对照组,则 d u = 0 du=0 du=0。 d t dt dt为政策虚拟变量,政策实施前 d t = 0 dt=0 dt=0,政策实施后 d t = 1 dt = 1 dt=1。 d u ∗ d t du*dt du∗dt为分组虚拟变量与政策虚拟变量的交互项,系数 α 3 \alpha_3 α3表示政策实施的净效应。
变量 | 意义 |
---|---|
d u du du | 分组虚拟变量。1表示实验组 |
d t dt dt | 政策虚拟变量。1表示政策后 |
α 3 \alpha_3 α3表示政策净影响的原因
政策实施前 政策实施后 区别 对照组 α 0 \alpha_0 α0 α 0 + α 2 \alpha_0+\alpha_2 α0+α2 α 2 \alpha_2 α2 实验组 α 0 + α 1 \alpha_0+\alpha_1 α0+α1 α 0 + α 1 + α 2 + α 3 \alpha_0+\alpha_1+\alpha_2+\alpha_3 α0+α1+α2+α3 α 2 + α 3 \alpha_2+\alpha_3 α2+α3 区别 α 1 \alpha_1 α1 α 1 + α 3 \alpha_1+\alpha_3 α1+α3 α 3 \alpha_3 α3
从上面可以看到, α 3 \alpha_3 α3是通过实验组与对照组在实验前后的比较构成的。因此叫做双重差分。
因此我们只需要关注 α 3 \alpha_3 α3就可以知道政策的净影响。
变量 含义 α 1 \alpha_1 α1 组别间的差异 α 2 \alpha_2 α2 时间的差距(自然发展) α 3 \alpha_3 α3 政策的影响
另一种模型
这种模型也是常见的模型
Y
i
t
=
α
0
+
α
1
d
u
∗
d
t
+
λ
i
+
ν
t
+
ε
i
t
Y_{it}=\alpha_0+\alpha_1du*dt+\lambda_i+\nu_t+\varepsilon_{it}
Yit=α0+α1du∗dt+λi+νt+εit
λ
i
\lambda_i
λi为固体效应,
ν
t
\nu_t
νt为时间固定效应。这两个变量是前面
d
u
du
du与
d
t
dt
dt的变量,可以更精准的反应个体特征与时间特征。
这个模型也叫做双向固定效应模型。固定效应的存在可以一定程度的减少遗漏变量造成的偏误。
为了模型的更加精确,我们还可以加入控制变量。(非观测误差等其余误差就都放在固定效应里了)
稳健性检验
两个方面
- 共同趋势的检验
目的是保证,在政策实施前实验组与对照组的发展特征是一致的。排除分组差异导致的结果差异。
- 确定是政策影响
共同趋势的检验保证了政策前的样本是差不多的。现在还需要保证,在政策发布后,样本没有突变,也没有别的因素影响样本们。
-
安慰剂检验
对样本进行虚构处理。
- 虚构政策发布时间。将政策时间提前。比如2023年发布了一个政策。我们可以把这个政策发布节点看成2020年,看看实验结果是否一致
- 虚构变量组。我们可以把不受政策影响的数据当成实验组,看看结果是否一致
-
更改对照组与解释变量
结果图的理解
图片来自 黄 细 嘉 等 《乡 村 旅 游 发 展 能 否 缩 小 城 乡 收 入 差 距 ?》旅 游 学 刊 第 38 卷 2023 年 第 2 期
每个点上下的虚线是95%的置信区间。
需要关注的是在政策点的前后95%置信区间是否包含0。如果在政策实施前的年份零在置信区间内,则说明满足平行趋势假设。同理如果在政策实施前零不在置信区间内,则不能说明满足平行趋势假设。政策实施后的点也同理。