【无标题】Bacon分解做交错DID数据、代码以及参考文献

此次分享的是一份交错did的计算代码以及相关计算数据

交错指的是对于在一个 (准) 实验研究样本中的个体接受处理时间不一致,而这种情形的存在会对传统的 DID 系数估计和原本直观的处理 (政策) 效果的解释产生影响。已经有不少文献对此进行了讨论 (Borusyak and Jaravel, 2017; Athey and Imbens, 2018; Goodman-Bacon, 2018; de Chaisemartin and D’Haultfoeuille, 2020; Imai andKim, 2020; Sun and Abraham, 2020)。

具体而言,一个研究样本中的处理组接受处理时间不一致,呈现出多个队列,用表示,同时处理组与对照组满足平行趋势,我们可以用特定队列事件研究回归 (cohort-specific event-study regression) 来表示这种情况:

图片

其中,指的是队列最长持续时间;是一个指示变量,表示一个观察值是否属于队列 同时在期接受处理;表示对于队列来说期的平均处理效应。

如果平均的处理效应不依赖于队列和队列接受处理的持续时间,那么我们可以将替换为 ,这样就回到了传统的 DID。但是,这里面有一个担心就是,平均处理效应会受处理队列以及接受处理时间长度的影响。正如前文所提到,已经有一些列文章讨论了这个问题。

对于这个问题,一个简单理解方式的是把  视为传统双重差分回归中存在的遗漏变量。那么一般DID所估计出来的系数,既包括上式中真实的系数,也包含遗漏变量在既有回归变量 (处理状态、个体和时间指示变量) 上的总体线性投影。因为遗漏变量是个求和, 也是对已有回归变量投影的求和。 真实系数为 0 (被其他回归项吸收了), 总体的回归系数真正识别的是 。 是对处理变量、个体、时间效应进行整体回归的系数。

简单来说,我们通过一般DID回归所得到的  本质上是多个 DID (子样本,) 加权平均,其权重取决于子样本规模、处理组与控制组规模、以及子样本处理时点的函数。这些权重加起来为 1,但是更为重要的一点是,有些权重可以为负,这些负的权重的存在会使得 DID 系数很难得到解释。

对于这样一种结果,至少有两种直觉上的解释,一是将前后接受处理的队列进行比较,事实上它们都是处理组而不是对照组,特别是当这种处理效应会随着时间和组别发生变化时,这样估计出来的系数就会对正实的效果产生误导。此外,因为 DID 假设不变的 ATT,它会把部分异质性效应归因于个体和时间处理效应。对于那些被处理期数更长以及在某个时期内处理个体数更多,就会吸收更多的处理效应。

部分数据如下:

图片

参考文献:

l Cook C J , Shah M . Aggregate Effects from Public Works: Evidence from India[J]. Review of Economics and Statistics, 2020:1-38.

相关研究:

[1]梁若冰, 席鹏辉. 轨道交通对空气污染的异质性影响——基于RDID方法的经验研究[J]. 中国工业经济, 2016(3):16.

[2]何靖. 延付高管薪酬对银行风险承担的政策效应——基于银行盈余管理动机视角的PSM—DID分析[J]. 中国工业经济, 2016(11):18.

[3]唐荣, 顾乃华. 高铁建设与上游生产性服务业发展——基于PSM-DID的实证检验[J]. 经济与管理研究, 2018, 39(7):11.

[4]庞娟, 冉瑞平. 石漠化综合治理促进了当地经济发展吗?——基于广西县域面板数据的DID实证研究[J]. 资源科学, 2019.

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

用数据说话用数据决策

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值