Average Treatment Effect (平均因果效应)的估计方法

最新推荐文章于 2023-07-26 22:50:58 发布

P_Y_L_U

最新推荐文章于 2023-07-26 22:50:58 发布

阅读量633

点赞数

分类专栏：统计文章标签：统计学统计模型

本文链接：https://blog.csdn.net/P_Y_L_U/article/details/129431870

版权

本文总结了平均治疗效应(ATE)的估计方法，包括随机化实验与观察型研究中的条件期望建模、逆概率加权方法和双稳健估计。在观察型研究中，由于协变量的存在，需要通过建模来估计ATE。文章讨论了不同的建模策略，如线性模型、logistic回归和倾向性得分模型，并强调了双稳健估计在模型误设定情况下的鲁棒性。

摘要由CSDN通过智能技术生成

对 treatment effect 建模的几种方法总结

$W$ : treatment index（exposure）
$W_i = \begin{cases} 1,& \rm if\;treatment \;(个体i在治疗组中)\\ 0, & \rm if \;control\;(个体i在控制组中) \end{cases}$

$\bf X$ : exposure covariates (协变量)

$Y$ : outcome (响应变量)

数据： $(Y_i, W_i, {\bf X}_i)$ , $i = 1, ..., n$

当个体 $i$ 位于治疗组中，只能观测到 $Y_{i1}= Y_i(W_i=1)$ ;
当个体 $i$ 处于控制组中，只能观测到 $Y_{i0}= Y_i(W_i=0)$ ;

目的：估计平均治疗效应 $\tau$ （average treatment effect）
$\tau = E\{Y(W=1)\} -E\{Y(W=0)\}=E(Y_1)-E(Y_0) \qquad\qquad (1)$
其中 $E\{Y(W=1)\}$ 简写为 $E(Y_1)$ 。

随机化实验

治疗组个体与控制组中个体一一对应
是否接受治疗与潜在响应是独立的，即 $(Y_0,Y_1)\underline{\;\|\;}\; W \qquad\qquad (2)$

令 $n_1 = \sum_{i=1}^n W_i$ ， $n_0 = n-n_1$ ，则
$\bar{Y}_1 = \frac{1}{n_1} \sum_{i=1}^n W_iY_i, \quad \bar{Y}_0 = \frac{1}{n_0} \sum_{i=1}^n (1-W_i)Y_i.$
平均治疗效应 $\tau$ 的无偏估计为
$\hat\tau = \bar{Y}_1-\bar{Y}_0。\qquad\qquad(3)$
此处有 $E(Y|W=1) = E\{Y_1W+Y_0(1-W)|W=1\}=E(Y_1|W=1)=E(Y_1)$ , $E(Y|W=0)=W(Y_0)$ 成立。

观察型研究

数据中控制组和治疗组个体不在一一对应，且条件(2)不在成立，使得 $E(Y|W=1)\neq E(Y_1)$ ， $E(Y|W=0)\neq E(Y_0)$ ，因此，（3）式也就不再是 $\tau$ 的无偏估计了。

$E(Y|W=1)=E(WY_1+(1-W)Y_0|W=1)$

协变量 $\bf X$ 可能与潜在响应和暴露(treatment exposure)有关， $(Y_0,Y_1)\;\underline{\;\|\;}\;W|{\bf X}.$

$\begin{aligned}\tau &= E(Y_1)-E(Y_0) \\ &= E\{E(Y|W=1,{\bf X})\}-E\{E(Y|W=0,{\bf X})\} \\ &= E\{E(Y|W=1,{\bf X})-E(Y|W=0,{\bf X})\}.\end{aligned}$

对响应变量的条件期望建模

假设 $E(Y|W=1,{\bf X}) = m({\bf X},W=1)$ , $E(Y|W=0,{\bf X}) = m({\bf X},W=0)$ , 则平均治疗效应的估计为：
$\begin{aligned}\hat\tau &= E\{m({\bf X},W=1)-m({\bf X},W=0)\}\\ &=\frac{1}{n}\sum_{i=1}^n\Big\{m_i({\bf X},W=1)-m_i({\bf X},W=0)\Big\}\end{aligned}。$