Causal Forest Theory

竹枝子

已于 2023-02-03 17:04:49 修改

阅读量878

点赞数

分类专栏：因果推断文章标签：人工智能算法

于 2023-01-28 00:08:58 首次发布

本文链接：https://blog.csdn.net/weixin_40260198/article/details/128673483

版权

因果森林总结：基于树模型的异质因果效应估计

Uplift model with multiple treatments

1. Estimation and Inference of Heterogeneous Treatment Effects using Random Forest

二元干预情形下估计 $\tau(x)=E[Y^1-Y^0|X=x]$

1.1 Asymptotic analysis

定理1

Under some condition,
$(\hat{\tau}(x)-\tau(x)) / \sqrt{\operatorname{Var}[\hat{\tau}(x)]} \Rightarrow \mathcal{N}(0,1)$
$\operatorname{Var}[\hat{\tau}(x)]$ 可以用infinitesimal jackknife估计 $\widehat{V}_{I J}(x) / \operatorname{Var}[\hat{\tau}(x)] \rightarrow 1$
$\widehat{V}_{I J}(x)=\frac{n-1}{n}\left(\frac{n}{n-s}\right)^2 \sum_{i=1}^n \operatorname{Cov}_*\left[\hat{\tau}_b^*(x), N_{i b}^*\right]^2$
其中，系数项 $n-1)n/(n-s)^2$ 只能对无放回的子抽样做修正

证明过程分为两步：

先证明偏差 $E[\hat \mu_n(x)-\mu(x)]$ 的bound

在这里插入图片描述

再证明 $\hat \mu_n(x)-E[\hat \mu_n(x)]$ 近似正态

利用Hajek projection和k-PNN先证明T is ν-incremental
$\stackrel{\circ}{T}=\mathbb{E}[T]+\sum_{i=1}^n\left(\mathbb{E}\left[T \mid Z_i\right]-\mathbb{E}[T]\right)$

在这里插入图片描述

1.2 Double-Sample Trees

回归树T分裂准则为最小化MSE， $\hat{\mu}(x)=\frac{1}{\left|\left\{i: X_i \in L(x)\right\}\right|} \sum_{\left\{i: X_i \in L(x)\right\}} Y_i=\bar Y_L$

$\sum_{i \in \mathcal{J}}\left(\hat{\mu}\left(X_i\right)-Y_i\right)^2=\sum_{i \in \mathcal{J}} Y_i^2-\sum_{i \in \mathcal{J}} \hat{\mu}\left(X_i\right)^2$

考虑到 $\sum_{i \in \mathcal{J}} \hat{\mu}\left(X_i\right)=\sum_{i \in \mathcal{J}} Y_i$ ，上式等价于最大化 $\hat{\mu}(X_i)$ 的方差

2. Generalized Random Forests

2.1 Algorithm

1. Forest-based local estimation

目的：给定 $O_i, X_i)$ ，估计 $\theta(\cdot)$ ，如估计HTE时， $O_i=(Y_i, W_i)$ 。
方法：求解方程 $\mathbb{E}\left[\psi_{\theta(x), v(x)}\left(O_i\right) \mid X_i=x\right]=0$ ，其中， $\theta(x), v(x)$ 分别是感兴趣的参数和无关参数

权重估计阶段： $\alpha_i(x)$ 衡量 $x_i$ 和 $x$ 的相似程度，将同一叶子结点中的"“共现频率”"作为其权重
$\alpha_{b i}(x)=\frac{\mathbf{1}\left(\left\{X_i \in L_b(x)\right\}\right)}{\left|L_b(x)\right|}, \quad \alpha_i(x)=\frac{1}{B} \sum_{b=1}^B \alpha_{b i}(x)$
其中 $L_b(x)$ 为第b棵树 $x$ 所在叶子结点的所有数据
加权求解
$(\hat{\theta}(x), \hat{v}(x)) \in \underset{\theta, v}{\operatorname{argmin}}\left\{\left\|\sum_{i=1}^n \alpha_i(x) \psi_{\theta, v}\left(O_i\right)\right\|_2\right\}$
例子：求解 $\mu(x)=\mathbb{E}\left[Y_i \mid X_i=x\right]=0$ ,取 $\psi_{u(x)}\left(Y_i\right)=Y_i-\mu(x)$ ，则有 $\sum_{i=1}^n \frac{1}{B} \sum \alpha_{b i}(x)\left(Y_i-\hat{\mu}(x)\right)=0$