【Python实战因果推断】34_双重差分5

目录

Identification Assumptions

Parallel Trends

No Anticipation Assumption and SUTVA


Identification Assumptions

您现在可能已经知道,因果推断是统计工具和假设之间的不断互动。在本文中,我选择从统计工具入手,展示 DID 如何利用单位和时间关系来估计治疗效果。这给了你一个具体的例子。现在,是时候深入探讨一下,在使用 DID 时,你做出了什么样的假设,有时甚至没有意识到这一点。

Parallel Trends

在本书之前的章节中,在处理横截面数据时,一个关键的识别假设是干预与潜在的结果无关,以观察到的协变量为条件。DID 有一个类似但较弱的假设:平行趋势。

仔细想想,DID 估计器在利用时间和单位相关性方面是非常直观的。如果只有单位(没有时间维度),就必须使用对照组来估计治疗组的 Y(0)。另一方面,如果有时间维度,但没有对照组(所有单位都在某个时间点接受过治疗),则必须使用接受治疗单位过去的 Y(0) 进行前后比较。这两种方法都需要很强的假设。您要么必须假定对照组的结果可以确定 E[Y(0) | D=1,Post=1],这只有在治疗组和对照组具有可比性的情况下才可行(比如在 RCT 中);要么假定治疗单位的结果是一条跨时间的平线,在这种情况下,您可以使用治疗单位过去的结果来确定 E[Y(0) | D=1,Post=1]。相比之下,"差分法 "做了一个较弱的假设:在没有干预的情况下,干预组和对照组在不同时间的结果轨迹平均是相同的。它假设 Y(0) 的趋势是平行的:

E\Big[Y(0)_{it = 1}-Y(0)_{it = 0}\Big|D=1\Big]=E\Big[Y(0)_{it = 1}-Y(0)_{it = 0}\Big|D=0\Big]

这个假设是无法检验的,因为它包含了一个不可观测的项: E\big[Y(0)_{it=1}\big|D=1\big] 。不过,为了便于理解,我们还是暂时假设你可以观察到所有时间段的 Y(0) 潜在结果。在下面的图中,我用虚线表示它们。在这里,你可以看到干预和对照组四个时段的潜在结果 Y(0)。此外,每幅图都有四个点,分别代表治疗组和对照组的观察数据,以及在对照组下治疗组的 DID 估计轨迹,用虚线表示。虚线与治疗组干预后结果之间的差值就是 ATT 的 DID 估计值。

而真正的 ATT 是治疗组治疗后干预结果与灰色虚线之间的差值,灰色虚线代表治疗组未观察到的 Y(0)

在第一幅图中,估计值和实际值 Y(0)|D=1 相吻合。在这种情况下,平行趋势假设得到满足,DID 估计器恢复了真实 ATT。在第二幅图中,趋势趋同。对于 Y(0)|D=1,估计趋势比实际趋势陡峭。因此,DID 估计值会向下偏倚:E[Y(1)|D=1,Post=1] 与估计趋势之间的差异小于 E[Y(1)|D=1,Post=1] 与实际但不可观测的 E[Y(0)|D=1,Post=1] 之间的差异。

最后,最后一幅图显示了平行趋势假设并不是规模不变的。这幅图只是将第一幅图中的数据进行对数变换,然后对结果进行对数变换。这种变换将原本平行的趋势变成了收敛趋势。我展示这幅图是为了提醒大家在使用 DID 时要非常小心。例如,如果您有水平数据,但想用百分比变化来衡量效果,那么将结果转换成百分比会扰乱您的趋势。

平行趋势假设与条件独立性假设(CIA)有另一种联系。条件独立假设指出,平均而言,治疗组和对照组的 Y(0) 水平是相同的,而平行趋势则指出,治疗组和对照组的 Y(0) 增长是相同的。这可以用您之前看到的 ΔYs 来表示:

(\Delta y_0,\Delta y_1)\perp T

面板数据的威力就在这里:即使干预不是随机分配的,只要干预组和对照组具有相同的反事实增长,ATT 就能被识别出来。

就像独立性假设一样,可以将平行趋势假设放宽到以协变量为条件。也就是说,给定一组干预前协变量 X,Y(0) 的趋势在干预组和对照组之间是相同的。稍后将介绍如何在 DID 中纳入协变量。

No Anticipation Assumption and SUTVA

如果说平行趋势假设可以看作是独立性假设的面板数据版本,那么无预期假设则更多地与处理值稳定单位假设(SUTVA)相关。还记得当效应从干预单位溢出到对照单位(或反之亦然)时,会发生违反 SUTVA 的情况吗?那么,这里的情况是一样的,只不过是跨时间段:你不希望效果溢出到尚未干预的时间段。

如果您认为这种情况不可能发生,那么请考虑一下您正试图估计 "黑色星期五 "对手机销售的影响。如果您尝试这样做,您会发现许多商家都会预期 "黑色星期五 "的折扣,因为他们知道在 "黑色星期五 "之前的那段时间,顾客已经在购买产品了。这很可能会让你在干预(黑色星期五)发生之前就看到销售高峰。

您需要担心时间溢出效应,但这并不意味着您不需要担心单位溢出效应。古老的 SUTVA 仍然是面板数据分析中的一个大问题,尤其是当单位是一个地理区域时。这是因为人们会不断跨越地理边界,这使得干预很可能会溢出被干预单位。

  • 26
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

水木流年追梦

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值