原创 人工智能之强化学习
第三部分是 基于三个假设的因果推论方法。在本节中,介绍现有的因果推断方法,这些方法依赖于第2节中介绍的三个假设。将会根据分类分为7小结进行解决,先来介绍第一种方法-重新加权方法。
根据控制混杂因素的方法,将这些方法分为以下类别:
(1)重新加权方法;
(2)分层方法;
(3)匹配方式;
(4)基于树的方法;
(5)基于表示的方法;
(6)多任务方法;
(7)元学习方法。
3.1重新加权方法
由于混杂因素的存在,治疗组和对照组的协变量分布不同,从而导致选择偏见问题,如2.4节所述。换句话说,治疗分配与观察数据中的协变量相关。样本重加权是克服选择偏差的有效方法。
通过为观察数据中的每个unit分配适当的权重,可以创建一个伪组,其治疗组和对照组的分布相似。
在样本重新加权方法中,关键概念是平衡分数。
平衡分数b(x)是一般的权重分数,它是x满足的函数:,其中W是治疗分配,x是背景变量。平衡分数的设计多种多样,显然,最琐碎的平衡分数是b(x)= x。此外,倾向得分也是平衡得分的特例。
定义9.倾向得分:倾向得分定义为给定背景变量的治疗的条件概率:
详细地,倾向得分表明在给定一组观察到的协变量的情况下将一个unit分配到特定治疗的概率。结合倾向得分的平衡得分是最常见的方法。
本节中提到的算法概述如图2所示。在下一节中将介绍基于倾向得分的样本重加权,然后是对样本和协变量进行加权的方法。