目录:
因果森林
广义随机森林
正交森林
因果树/因果森林:
异质性(Heterogeneity)
-
一个变量X对另一个变量Y的影响可能因个体而异
直接训练普通 CART 树(特征为X, 输出为 T ), 然后套用上式评估CATE。
目标:从协变量中,找到一个最优分裂节点,最大化子节点间处理效应差异。
因果树:使得每个组中都有实验组个体与对照组个体,因此每个分组都构成了一个人为构造的实验,可以直接计算出处理效应
因果森林由多棵因果树构成,由于需要Honest estimation(用互不重合的数据分别进行split和estimate),因此相较于决策树,每棵因果树split的分裂准则修改如下:
此公式引用于《Recursive Partitioning for Heterogeneous Causal Effects》 2015年
另外一篇文章也提到了诚实的方法
将训练样本分成两份
-
训练集Str:一份用来先训练普通 CART 树(特征为 X, 输出为T ),把相似的个体放到一个叶节点
<