python 双重差分_双重差分的理论与实践

本文介绍了双重差分模型在政策效果评估中的应用,阐述了其理论基础和模型公式,并通过R和Stata的代码示例展示了如何进行双重差分估计。重点讨论了交互项的含义、平行性假定及其检验方法,包括回归分析和图形检验。
摘要由CSDN通过智能技术生成

1. 理论

1.1 标准表述(定义)

双重差分模型(difference-in-differences)主要被用于社会学中的政策效果评估。其原理是基于一个反事实的框架来评估政策发生和不发生这两种情况下被观测因素y的变化。如果一个外生的政策冲击将样本分为两组—受政策干预的Treat组和未受政策干预的Control组,且在政策冲击前,Treat组和Control组的y没有显著差异,那么我们就可以将Control组在政策发生前后y的变化看作Treat组未受政策冲击时的状况(反事实的结果)。通过比较Treat组y的变化(D1)以及Control组y的变化(D2),我们就可以得到政策冲击的实际效果(DD=D1-D2)。

具体地,单一冲击时点的双重差分的模型如下:

其中,Ti为政策虚拟变量;Ai为时间虚拟变量; Ti ×At为两者的交互项;b3即为我们需要的双重差分估计量。

政策冲击的实际效果: DD = D1 - D2 = ( β2 + β3 ) - β2 = β3

需要特别指出的是,只有在满足“政策冲击前Treat组和Control组的y没有显著差异”(即平行性假定)的条件下,得到的双重差分估计量才是无偏的。

详细说明

为测度“处理”(或实验)的效果,我们关心被解释变量经“处理”前后的变化,考虑以下两期面板数据:

混合OLS

只加政策变量作为核心解释变量,再加入时间D(t)等作为控制变量,进行的普通混合OLS回归,测度出x(it)的效应β,就是简单地将实验组减去控制组,得到一个有偏的估计(因为x(it)可能与不随时间改变的个体特征u(i)等固定效应相关),故下一步再做一阶差分,第二期减去第一期,将u(i)消掉。即双重差分。

双重差分DID

示意图

只有在满足“政策冲击前Treat组和Control组的y没有显著差异”(即平行性假定)的条件下,得到的双重差分估计量才是无偏的。

1.2 另一种表述(常用)

1.2.1 理解交互项的含义

例子:研究性别和学历对工资的影响,性别是F,学历是E,工资是S。如果没有交叉项,那么回归的方程是:

S = β0 + β1 × F + β2 × E

在这种情况下,性别的影响是β1,学历的影响是β2。而有交叉项,那么回归的方程是

S = β0 + β1 × F + β2 × E + β3 × F × E

在这种情况下,性别对工资的影响是β1+β3*E,学历对工资的影响是β1+β3*F

所以我们很容易发现,交叉项刻画了什么呢?

它刻画了一个人的学历对工资的影响是否受性别的影响(β1+β3*F),刻画了一个人的性别对工资的影响是否受学历的影响(β

  • 1
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值