【Python实战因果推断】1_因果效应异质性1

最新推荐文章于 2025-05-19 18:10:53 发布

水木流年追梦

最新推荐文章于 2025-05-19 18:10:53 发布

阅读量1k

点赞数 23

分类专栏：因果推断文章标签： python 开发语言

本文链接：https://blog.csdn.net/qq_32146369/article/details/139050928

版权

因果推断专栏收录该内容

189 篇文章

订阅专栏

From ATE to CATE

Why Prediction Is Not the Answer

CATE and ITE

本文将介绍应用于行业的因果推理中最有趣的发展：效应异质性。在此之前，你们了解的是一种治疗方法的一般影响。现在，你将专注于发现它如何对不同的人产生不同的影响。治疗效果并非恒定不变，这个想法很简单，但却非常强大。了解哪些单位对某种治疗的反应更好，是决定谁接受治疗的关键。效应异质性为个性化这一备受推崇的理念提供了一种因果推理方法。首先，您将从理论层面了解效应异质性，了解估计效应异质性的挑战是什么，以及如何扩展已学知识以应对这些挑战。接下来，您将看到效应异质性的估算与预测性研究密切相关。
异质性效应与预测问题密切相关，而预测问题对于数据科学家来说已经非常熟悉了。因此，您将看到交叉验证和模型选择的理念如何仍然适用于治疗异质性模型。然而，验证效果估计值比评估简单的预测模型更具挑战性，这就是为什么你会看到一些新颖的方法。
最后提供了一些如何使用效应异质性指导决策的指南和示例。虽然并非详尽无遗，但我希望这些示例能告诉您如何将这些想法用于解决自己的业务问题。

From ATE to CATE

到目前为止，你们每次估算治疗的因果影响时，大多都是平均治疗效果：

$\tau=E\bigl[Y_1-Y_0\bigr]$ 或者是等价的连续治疗 $\tau=E[y'(t)]$ ， $y'(t)$ 是治疗反应函数的导数。

也就是说，您已经学会了揭示治疗总体有效性的技术。ATE 估算是因果推理的基石。它是一个超级有用的工具，可用于决策问题，也就是所谓的项目评估：当你想知道是否应该在整个人群中推广一种治疗方法时。

现在，是时候学习如何为另一种类型的决策提供信息了：你应该对哪个单位进行治疗？为此，您需要允许决策从一个单位变为另一个单位。

例如，给某个客户提供折扣券可能是有益的，但不给另一个客户，因为某个客户可能对折扣更敏感。或者，将疫苗优先提供给某一群体而不是另一群体也是有道理的，因为这些群体会从这种待遇中获益更多。在这种情况下，个性化是关键。

实现个性化的一种方法是将效果异质性考虑在内，即估算条件平均治疗效果 (CATE)。通过考虑每个单位的独特特征，您可以确定针对该特定案例的最有效治疗方法： $E\bigl[Y_1-Y_0\bigl|X\bigr] \mathrm{or} E\bigl[y'(t)\bigl|X\bigr]$

以 X 为条件意味着，您现在允许治疗效果因每个单位的协变量 X 所定义的特征而异。同样，在这里，您认为并非所有单位都对治疗有同样好的反应，您希望利用这种异质性。您希望只对合适的单位进行治疗（在二元情况下），或者找出每个单位的最佳治疗剂量（在连续情况下）。

例如，如果您是一家银行，需要决定每位客户有资格获得的贷款额度，那么您可以肯定的是，向每个人发放大量资金并不是一个好主意，尽管这对某些人来说可能是合理的。你必须精明地处理（贷款额度）。也许，根据客户的信用评分，您可以找出合适的贷款额度。当然，您并不需要成为一家大型机构来利用个性化服务。我们不乏这样的例子。您应该在一年中的哪几天进行销售？产品价格应该是多少？每个人的运动量是多少？

Why Prediction Is Not the Answer

可以这样想。您有一群客户和一种处理方法（价格、折扣、贷款......），您想对处理方法进行个性化，例如，给不同的客户不同的折扣。假设您可以按结果图将客户组织成以下处理方式：

您可以将个性化任务视为客户细分问题。您要根据客户对您的处理方式的反应来创建客户群。例如，您想找到对折扣反应好的客户和对折扣反应差的客户。

那么，客户对处理方法的反应由条件处理效果 $\frac{\delta Y}{\delta T}$ 给出。因此，如果您能以某种方式估算出每位顾客的条件处理效果，您就能将那些对处理效果好的顾客（高处理效果）和那些对处理效果差的顾客进行分组。如果能做到这一点，就能像下图一样分割客户空间：

这就太好了，因为现在你可以估算出每个组的不同治疗效果。同样，由于疗效只是治疗反应函数的斜率，如果你能得出斜率不同的组别，那么这些分区的实体对治疗的反应就会不同：

现在，将其与传统的机器学习方法进行对比。您可能会尝试预测 Y，而不是每个单元的导数 $\frac{\delta Y}{\delta T}$ 。假定你的预测模型能很好地逼近目标，这将从根本上分割 Y 轴上的空间。然而，这并不一定会导致各组具有不同的治疗效果。这就是为什么简单地预测结果并不总是对决策有用：

好吧，你可能会说，我知道我必须估计效果，而不仅仅是预测结果，但这有点棘手。如果我看不到斜率 $\frac{\delta Sales}{\delta Discount}$ ，我怎么能预测它呢？

说得好。与原始结果 Y 不同，斜率（或变化率）在单位层面上基本上是不可观测的。要想看到单个斜率，就必须观察每个单位在不同处理水平下的情况，并计算每个处理结果的变化情况：

$\frac{\delta Y_i}{\delta T_i}\approx\frac{Y(T_i)-Y(T_i+\epsilon)}{T_i-(T_i+\epsilon)}$

这又是因果推论的根本问题。在不同的治疗条件下，你不可能看到相同的单位。那么，你能做什么呢？

CATE and ITE

请记住，CATE 不同于个体治疗效果（ITE）。例如，假设您有两组病人，x = 1 和 x = 2，每组 4 个单位，您想知道一种新药对一种疾病的治疗效果，这种疾病通常会导致 50%的患者死亡。
对于 x = 1 组，该药物对一名病人不利，导致其死亡，但却挽救了另一名病人。对于 x = 2 组，药物效果为零，其中 1 人死亡（请记住，这种疾病的致死率为 50%）。在这两组中，CATE 都是 0.5，但没有一个单位的 ITE 是 0.5。