【无标题】Bacon分解做交错DID数据、代码以及参考文献

最新推荐文章于 2024-07-25 23:26:35 发布

用数据说话用数据决策

最新推荐文章于 2024-07-25 23:26:35 发布

阅读量368

点赞数

文章标签：算法 python

本文链接：https://blog.csdn.net/yushibing717/article/details/135093154

版权

此次分享的是一份交错did的计算代码以及相关计算数据

交错指的是对于在一个 (准) 实验研究样本中的个体接受处理时间不一致，而这种情形的存在会对传统的 DID 系数估计和原本直观的处理 (政策) 效果的解释产生影响。已经有不少文献对此进行了讨论 (Borusyak and Jaravel, 2017; Athey and Imbens, 2018; Goodman-Bacon, 2018; de Chaisemartin and D’Haultfoeuille, 2020; Imai andKim, 2020; Sun and Abraham, 2020)。

具体而言，一个研究样本中的处理组接受处理时间不一致，呈现出多个队列，用表示，同时处理组与对照组满足平行趋势，我们可以用特定队列事件研究回归 (cohort-specific event-study regression) 来表示这种情况：

其中，指的是队列最长持续时间；是一个指示变量，表示一个观察值是否属于队列同时在期接受处理；表示对于队列来说期的平均处理效应。

如果平均的处理效应不依赖于队列和队列接受处理的持续时间，那么我们可以将替换为，这样就回到了传统的 DID。但是，这里面有一个担心就是，平均处理效应会受处理队列以及接受处理时间长度的影响。正如前文所提到，已经有一些列文章讨论了这个问题。

对于这个问题，一个简单理解方式的是把视为传统双重差分回归中存在的遗漏变量。那么一般DID所估计出来的系数，既包括上式中真实的系数，也包含遗漏变量在既有回归变量 (处理状态、个体和时间指示变量) 上的总体线性投影。因为遗漏变量是个求和，也是对已有回归变量投影的求和。真实系数为 0 (被其他回归项吸收了)，总体的回归系数真正识别的是。是对处理变量、个体、时间效应进行整体回归的系数。

简单来说，我们通过一般DID回归所得到的本质上是多个 DID (子样本，) 加权平均，其权重取决于子样本规模、处理组与控制组规模、以及子样本处理时点的函数。这些权重加起来为 1，但是更为重要的一点是，有些权重可以为负，这些负的权重的存在会使得 DID 系数很难得到解释。

对于这样一种结果，至少有两种直觉上的解释，一是将前后接受处理的队列进行比较，事实上它们都是处理组而不是对照组，特别是当这种处理效应会随着时间和组别发生变化时，这样估计出来的系数就会对正实的效果产生误导。此外，因为 DID 假设不变的 ATT，它会把部分异质性效应归因于个体和时间处理效应。对于那些被处理期数更长以及在某个时期内处理个体数更多，就会吸收更多的处理效应。

部分数据如下：

参考文献：

l Cook C J , Shah M . Aggregate Effects from Public Works: Evidence from India[J]. Review of Economics and Statistics, 2020:1-38.

相关研究：

[1]梁若冰, 席鹏辉. 轨道交通对空气污染的异质性影响——基于RDID方法的经验研究[J]. 中国工业经济, 2016(3):16.

[2]何靖. 延付高管薪酬对银行风险承担的政策效应——基于银行盈余管理动机视角的PSM—DID分析[J]. 中国工业经济, 2016(11):18.

[3]唐荣, 顾乃华. 高铁建设与上游生产性服务业发展——基于PSM-DID的实证检验[J]. 经济与管理研究, 2018, 39(7):11.

[4]庞娟, 冉瑞平. 石漠化综合治理促进了当地经济发展吗?——基于广西县域面板数据的DID实证研究[J]. 资源科学, 2019.

用数据说话用数据决策

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
【无标题】Bacon分解做交错DID数据、代码以及参考文献

交错指的是对于在一个 (准) 实验研究样本中的个体接受处理时间不一致，而这种情形的存在会对传统的 DID 系数估计和原本直观的处理 (政策) 效果的解释产生影响。那么一般DID所估计出来的系数，既包括上式中真实的系数，也包含遗漏变量在既有回归变量 (处理状态、个体和时间指示变量) 上的总体线性投影。对于这样一种结果，至少有两种直觉上的解释，一是将前后接受处理的队列进行比较，事实上它们都是处理组而不是对照组，特别是当这种处理效应会随着时间和组别发生变化时，这样估计出来的系数就会对正实的效果产生误导。
复制链接

扫一扫