提纲:
处理行为发生在不同时间点时,要进行多期双重差分
(注意:处理行为不可逆)
贯穿双重差分的例子:去淄博吃烧烤,能长胖吗?
样本分为三组:
组1:山东美食爱好者 三月淄博吃烧烤
组2:外甥美食爱好者 五月淄博吃烧烤
组3:非美食爱好者 不去淄博吃烧烤
一、什么是多期双重差分?
传统双重差分 | 多期双重差分 | |
![]() | → | ![]() |
T (无法设置) | 可以转换为一组时01变量 | |
替换成一组组别的01变量 | ||
D✖T看成整体,则与变量“淄博吃烧烤”含义相同 变换成Dit,含义:某组别在某时间点,是否已经接受了处理行为。 | ||
综上所述,多期双重差分一般形式如下: 和固定效应模型形式相同,因此叫做Two-way fixed-effects diff-in-diff(TWFEDD) |
注意!!!:(TWFEDD)是错的。
二、多期双重差分(TWFEDD)为什么是错的?
(一)依据:
论文中有严谨的推导过程,有需要的小伙伴请自行去翻看
(二)多期双重差分(TWFEDD)错误原因
3DD4有问题。(剧透)
1.
以去淄博吃烧烤,能长胖吗?为例:
画出图像; 进行分组,方便后续拆分分析
分解后,分别用四个红色变量进行代表。这四个变量的加权平均数,代表了多期双重差分中3处理行为效果。如下图所示:
例子:去淄博吃烧烤,能长胖吗?
3DD1 DD2 DD3 DD4分别代表的是:
山东vs非吃货;外省vs非吃过;山东vs外甥;外省vs山东
2.“S”权重是什么?
来自二(一)中提到的论文
![]() ![]() ![]() | “s"会受到什么的影响? 每组样本量的影响 |
![]() ![]() | 分组时间长短 (上述第一条公式,没有绿圈内容。因为第一项体现的是所有组别与非处理组之间的比较,是覆盖所有时间点的。因此第一个公式中时间长短就取1。) |
| 子样本的波动(variance) 1.子样本中两组样本量比值 2.子样本中处理行为的时间 |
3.为什么
3DD4有问题?
例子:去淄博吃烧烤的实际处理行为效果为,吃烧烤后第一个月体重增加2kg,第二个月体重增加1kg,第三个月体重恢复正常水平。
4月-6月间:由于其他时间因素引起的体重变化为,每月增加0.5kg。
(手动朝下)
第一重差分:
“4”?
因为对照组“山东组”已经是接受过处理行为的个体了。
二、那什么时候使用TWFEDD呢?
用:处理效果恒定
不能用:处理效果变化(效果逐渐增加、逐渐减弱等。)