因果推断（五）：RDD断点回归设计中处置效应的计算

WhyNot?

已于 2023-10-10 20:00:36 修改

阅读量648

点赞数 2

分类专栏：因果推断文章标签：人工智能算法笔记

于 2023-09-14 22:41:14 首次发布

本文链接：https://blog.csdn.net/JESSIENOTCAR/article/details/132870508

版权

因果推断专栏收录该内容

10 篇文章

订阅专栏

文章目录

一、RDD中LATE的计算方式
二、两次回归
三、一次回归
四、去中心化

一、RDD中LATE的计算方式

在这里插入图片描述

二、两次回归

所谓的两次回归指的是，在断点左边和右边，根据数据样本，分别拟合一条曲线。两条曲线在断点这条直线上的截距项，作为我们想要估计的 $L A TE$ 。
在这里插入图片描述

断点左边这条线外层指定的函数是： $Y^0=\alpha_0^0+\beta_1^0x+\epsilon_0 \tag{1}$ 假设 $x$ 表示高考得分： $Y$ 表示收入，处置为进入一本或不进入一本，则式中的:

$\alpha_0^0$ 指的是截距项，即不受高考得分影响的平均收入水平；
$\beta_1^0$ 指的斜率，即收入随着高考得分增长的边际价值；
$\epsilon_0$ 指的随机误差项，即模型无法完全捕捉的随机性和不确定性；
$Y^0$ 表示 $x < c$ (断点)的结果。

右边这条线指定的函数是： $Y^1=\alpha_0^1+\beta_1^1x+\beta_2*D+\epsilon_1 \tag{2}$ 式中的：

$\alpha_0^1$ 指的是截距项，即不受高考得分影响和是否上一本的平均收入水平；
$\beta_1^1$ 指的斜率，即收入随着高考得分增长的边际价值；
$\beta_2^1$ 是我们想要的 $L A TE$ ，即处置的边际价值； $\epsilon_1$ 指的随机误差项，即模型无法完全捕捉的随机性和不确定性；
$Y^1$ 表示 $x > c$ (断点)的结果。

此时 $L A TE$ 的推导如下：
$E(Y^1-Y^0|x=c)= (\alpha_0^1+\beta_1^1x+\beta_2*D+\epsilon_1)- (\alpha_0^0+\beta_1^0x+\epsilon_0) \tag {3}$
因为 $\alpha_0^0$ 和 $\alpha_0^1$ 都表示不受高考分数和处置影响的平均收入水平，所以：
$\alpha_0^0 = \alpha_0^1 \tag{4}$
因此，忽略掉两个误差项后：
$LATE=(\beta_1^1-\beta_1^0)*x+\beta_2 \tag{5}$
若左右两边回归函数的斜率一致，即：
$\beta_1^1 =\beta_1^0 \tag{6}$
则：
$LATE=\beta_2 \tag{7}$
否则：
$LATE=(\beta_1^1-\beta_1^0)*c+\beta_2 \tag{8}$
问题一：怎么看待回归曲线斜率不一致的问题？等我知道了再补充。🐶

三、一次回归

所谓的一次回归，指的是直接用一个函数做拟合，其实本质和上面是一样的，只是两个式子合并成了用一个式子表达：
$=\alpha_0+\beta_1x+\beta_2*D+\beta_3*x*D+\epsilon \tag{9}$
为什么可以写成这样呢？我们分别看下处置 $D = 0$ 和不处置 $D = 1$ 时，这个式子会变成什么样：
$Y=\begin{cases} \alpha_0+\beta_1x+\epsilon & x<c,D=0 \\ \alpha_0+\beta_1x+\beta_2+\beta_3*x+\epsilon & x>c,D=1 \\ \end{cases} \tag{10}$
上式的第一个表达式是不是和式（1）一样？就不用再解释啦。关键是第二个表达式怎么理解？第二个式子跟式（2）唯一的区别是多了一个交互项： $\beta_3*x$ ，这里其实是为了考虑左右两边回归曲线的斜率不一致的场景，当 $\beta_3=0$ 时，左右两边回归曲线的斜率相等，否则不等。

此时的LATE为：
$Y^1-Y^0=(\alpha_0+\beta_1c+\beta_2+\beta_3c+\epsilon)-(\alpha_0+\beta_1c+\epsilon)=\beta_2+\beta_3c \tag{11}$

四、去中心化

所谓去中心化，就是将：
$=\alpha_0+\beta_1x+\beta_2*D+\beta_3*x*D+\epsilon \tag{9}$
中凡是涉及 $x$ 的项，都用 $x - c$ 来代替，即变成：
$=\alpha_0+\beta_1(x-c)+\beta_2*D+\beta_3*(x-c)*D+\epsilon \tag{12}$
这么做有什么好处呢？我们先来推导一下去中心化以后的 $L A TE$ ：
$D=1时：Y^1=\alpha_0+\beta_1(x-c)+\beta_2+\beta_3*(x-c)+\epsilon \tag{13}$
$D=0时：Y^0=\alpha_0+\beta_1(x-c)+\epsilon \tag{14}$
因此 $L A TE$ 可以表示为：
$Y^1-Y^0=\beta_2$
可以看到去中心化前后的LATE计算的表达式分别为： $\beta_2+\beta_3c$ 和 $\beta_2$ 。看起来是不是很困惑？到底哪个是对的呢？其实这两个是相等的！我们将式（12）换一套字符表达：
$=\alpha_0^{'}+\beta_1^{'}(x-c)+\beta_2^{'}*D+\beta_3^{'}*(x-c)*D+\epsilon \tag{15}$
然后我们再来比较下去中心化之前的式（9）：
$=\alpha_0+\beta_1x+\beta_2*D+\beta_3*x*D+\epsilon \tag{9}$
和去中心化之后的式（15）：
$=\alpha_0^{'}+\beta_1^{'}(x-c)+\beta_2^{'}*D+\beta_3^{'}*(x-c)*D+\epsilon \tag{15}$
我们将式（15）展开可以得到：
$=\alpha_0^{'}+\beta_1^{'}x+(\beta_2^{'}-\beta_3^{'}c)*D+\beta_3^{'}*x*D-\beta_1^{'}c+\epsilon \tag{16}$
可以看到：
$\alpha_0 = \alpha_0^{'}, \beta_1 = \beta_1^{'}, \beta_3 = \beta_3^{'}, \beta_2 =\beta_2^{'}-\beta_3^{'}c,$
从最后一个等式可以推出：
$\beta_2^{'} = \beta_2+\beta_3^{'}c ,$
因为：
$\beta_3 = \beta_3^{'},$
所以：
$\beta_2^{'} = \beta_2+\beta_3c ,$

等式前一项是去中心化之后的 $L A TE$ ，等式的后一项是去中心化之前的的 $L A TE$ ！！！这也是为什么说去中心化理论上并不会改变计算的LATE的值。