《因果学习周刊》第8期：因果反事实预测

智源社区

于 2021-12-30 14:28:23 发布

阅读量1k

点赞数

文章标签：算法大数据编程语言 python 机器学习

原文链接：https://mp.weixin.qq.com/s?__biz=MzU5ODg0MTAwMw==&mid=2247517902&idx=2&sn=e00e40ecb6760dc1fc5bc2598e919a89&chksm=febcc50ac9cb4c1c2f54e872a8f5351e9a5778cd5d7c7992d14bf3a52ab6cd95b736e8edf52d&scene=126&&sessionid=0

版权

No.08

智源社区

因果学习组

因

果

学

习

研究

观点

资源

活动

关于周刊

因果学习作为人工智能领域研究热点之一，其研究进展与成果也引发了众多关注。为帮助研究与工程人员了解该领域的相关进展和资讯，智源社区结合领域内容，撰写了第8期《因果学习周刊》。

反事实推断问题(Counterfactual Prediction)在Pearl的因果之梯中处于最顶层，是因果推断尝试解决的顶层问题，也是赋予机器“联想”能力的重要途径。反事实推断在政策评估、科学实验分析、个人风险评估等诸多领域都有十分重要的应用，且在因果推断和机器学习交叉的趋势下，反事实思想和反事实推断在机器学习领域中也出现了很多成功案例。本期主要介绍了反事实推断的一些文章，特别是近期发表于ICML与NeurIPS的一些工作，希望给相关的研究者带来一些帮助。

告诉大家一个好消息，《因果学习周刊》已经开启“订阅功能”，以后我们会向您自动推送最新版的《因果学习周刊》。订阅方法：请点击本文下方的“阅读原文”，进入《因果学习周刊》Hub社区版，点击作者栏“因果学习周刊”后选择“关注TA”。(注：《因果学习周刊》Hub社区版内有详细的订阅步骤图示介绍)。

本期贡献者：刘家硕

论文推荐

标题：UBC｜Counterfactual Prediction with Deep Instrumental Variables Networks了解详情

简介：我们正处在人工智能技术的应用和作用显著提升的时期。这种增长在很大程度上是由深度学习架构的成功来推动的，即通过多层表征将观察对象映射到最终输出。这些深度学习算法是非结构化预测的有效工具，它们可以结合进人工智能系统中来解决复杂的自动推理问题。本文提供了一种方法，可以结合机器学习算法来解决存在工具变量情况下的因果效应。我们证明了寻找工具变量可以分解为两个预测任务，可以用深度神经网络解决：第一阶段的网络用于预测Treatment变量，第二阶段网络的损失函数涉及对Treatment条件分布的积分。这个Deep IV框架在训练过程中的随机梯度下降过程中加入了一些特定的结构，这一框架可以借助于机器学习算法的优势并且避免过量的算法开销。我们概述了如何获得样本外的因果校验从而避免过拟合。我们还介绍了利用贝叶斯和频率推理的方案：前者利用了一种新的Dropout的变种，而后者使用了数据切分的手段。

论文地址：https://arxiv.org/pdf/1612.09596.pdf

推荐理由：本文提出了Deep IV框架来寻找数据中的工具变量，对相关领域有着很大的推动作用，影响力较大值得推荐。

Hub地址：https://hub.baai.ac.cn/view/12234

标题：ICML16 & NYU｜Learning Representations for Counterfactual Inference了解详情

简介：由于医疗保健、教育、就业和生态等领域的数据广泛积累，观察性研究的重要性正在上升。我们考虑的任务是回答一些与反事实的问题，例如，“如果这位病人接受了不同的药物治疗，她的血糖会降低吗?“。我们提出了一种新的反事实推理算法框架，该框架融合了领域自适应和表示学习的思想。除了理论论证外，我们还与现有的因果推理方法进行了实验比较。我们的深度学习算法显著优于之前的基准方法。

论文地址：https://arxiv.org/pdf/1605.03661.pdf

推荐理由：本文属于较早期的反事实推理与表征学习结合的方法，对这个方向的发展有着较大的推动作用。

Hub地址：https://hub.baai.ac.cn/view/12589

标题：NeurIPS17 & Adobe｜Matching on Balanced Nonlinear Representations for Treatment Effects Estimation了解详情

简介：由于缺少反事实数据，从观察数据估计治疗效果是具有挑战性的。数据匹配是解决这一问题的有效策略。常用的匹配方法如最近邻匹配(NNM)将治疗单元与协变量最相似的对照单元配对，然后根据协变量估计治疗效果。然而，当对照组和治疗组的分布不平衡时，现有匹配估计器的性能较差。此外，理论分析表明，因果效应估计的偏差会随着协变量维数的增加而增加。在本文中，我们的目标是通过学习观测数据的低维平衡和非线性表示(BNR)来解决这些问题。特别地，我们将反事实预测转化为分类问题，开发了一个带有领域自适应约束的核学习模型，并设计了一个新的匹配估计器。将数据投影到低维子空间后，协变量的维数将显著降低。在几个模拟和真实数据集上的实验证明了我们的方法的有效性。

论文地址：https://proceedings.neurips.cc/paper/2017/file/b2eeb7362ef83deff5c7813a67e14f0a-Paper.pdf

推荐理由：本文使用核方法来进行数据的匹配，具有较好的理论性质与实际效果，值得借鉴。

Hub地址：https://hub.baai.ac.cn/view/12590

标题：ICML17 & NYU｜Estimating individual treatment effect: generalization bounds and algorithms了解详情

简介：人们对将机器学习应用于医疗、经济和教育等领域的因果推理问题有着浓厚的兴趣。特别是，个人层面的因果效应估计具有重要的应用，如精准医疗。我们给出了一种新的理论分析和算法族来预测个体治疗效应(ITE)，在已知的强忽略(Strong Ignorability)假设下。算法学习一种“平衡”的表示，使得治疗组的分布和对照组分布看起来相似，我们推导出了一个新颖和直观的泛化误差界，显示出期望的ITE估计误差的上界可以表示为该表征上标准误差与对照实验组间分布距离之和。我们使用积分概率度量来测量分布之间的距离，推导出明确的Wasserstein距离和最大平均偏差(MMD)距离的界限。真实和模拟数据的实验表明，新算法的性能达到或超过了目前最先进的算法。

论文地址：https://arxiv.org/pdf/1606.03976.pdf

推荐理由：本文给出了ITE估计的泛化误差界与相应的算法，具有比较好的理论性质，值得借鉴。

Hub地址：https://hub.baai.ac.cn/view/12591

标题：NeurIPS20 & Oxford｜Estimating the Effects of Continuous-valued Interventions using Generative Adversarial Networks了解详情

简介：虽然从观察数据估计离散干预的效果的问题得到了很大的关注，但在设置连续值的干预，如与剂量参数相关的治疗方面，现有工作相对较少。在本文中，我们使用生成式对抗网络(GANs)框架来解决这个问题。我们的模型SCIGAN是灵活的，能够同时估计几种不同的连续干预的反事实结果。核心思想是使用一个显著改进的GAN模型来学习生成反事实的结果，然后可以用来学习一个推理模型，使用标准监督方法，能够估计这些反事实的一个新样本。为了解决由离散干预转向连续干预所带来的挑战，我们为我们的判别器提出了一个新颖的架构——我们构建了一个分层判别器，它利用了连续干预设置的结构。此外，我们提供了理论结果来支持我们使用GAN框架和分层判别器。在实验部分，我们介绍了一种用于连续干预设置的新的半模拟数据产生机制，并显示出了本方法对于现有基准模型的提升。

论文地址：https://arxiv.org/pdf/2002.12326.pdf

推荐理由：本文使用GAN来进行连续干预值效果的估计，具有较强的创新性与实际意义。

Hub地址：https://hub.baai.ac.cn/view/12592

标题：ICML20 & NYU｜DeepMatch: Balancing Deep Covariate Representations for Causal Inference Using Adversarial Training了解详情

简介：本文主要研究了多协变量及其之间存在复杂关系的情形下最优的协变量平衡方法。标准方法如倾向加权和匹配/平衡在这种情形下会失败，这是由于校正不当的倾向网络与不恰当的协变量表示。我们提出了一种基于加权和判别网络对抗性训练的新方法，有效地解决了这样的问题。这一点通过对该方法的新理论描述以及使用全连接架构来学习复杂关系和使用卷积架构来处理图像混杂因素的实验结果得到了证明，体现了这种新方法可以在这些具有挑战性的问题设置中实现强大的因果分析。

论文地址：https://arxiv.org/pdf/1802.05664.pdf

推荐理由：本文研究了在复杂协变量情况下的数据匹配问题，具有很强的创新性。

Hub地址：https://hub.baai.ac.cn/view/12593

标题：NeurIPS20 & Oxford｜Identifying causal-effect inference failure with uncertainty-aware models了解详情

简介：为个人推荐最佳方案是个人层面因果效应估计的主要应用。这种应用程序通常需要在安全关键的领域(如医疗保健)中使用，在这些领域中，评估不确定性并向决策者传达不确定性是至关重要的。我们介绍了一种实用的方法，将不确定性估计整合到最先进的神经网络方法中，来进行个人层次的因果估计。我们表明，我们的方法使我们能够优雅地处理“无重叠”的情况，这种情况在高维数据中是常见的，并且会使得标准的因果效应估计方法失败。此外，我们的方法允许我们处理协变量移位，即列车和测试分布不同的地方，这在实际部署系统时很常见。我们表明，当这种协变量移位发生时，正确地建模不确定性可以防止我们给出过度自信和潜在有害的建议。我们使用一系列最先进的模型来演示我们的方法。在协变量移位和缺乏重叠的情况下，我们的方法可以在预测不可信时提醒决策者，同时优于使用倾向评分来识别缺乏重叠的标准方法。

论文地址：https://arxiv.org/pdf/2007.00163.pdf

推荐理由：本文将不确定性评估纳入到了机器学习模型之中，使得模型能够给出决策的置信度，对于可信赖的机器学习有着重要的作用。

Hub地址：https://hub.baai.ac.cn/view/12594

标题：ICLR20 & Oxford｜Estimating Counterfactual Treatment Outcomes over Time Through Adversarially Balanced Representations了解详情

简介：确定什么时候给病人治疗和如何在多种治疗中选择是重要的医疗问题，有一些现有的解决方案。在本文中，我们介绍了反事实复发网络(CRN)，这是一种新颖的序列到序列模型，利用日益可用的患者观察数据来估计治疗效果随时间推移，并回答此类医学问题。为了处理观察数据中来自时变混杂因素、影响治疗分配策略的协变量偏差，CRN使用领域对抗训练来构建患者历史的平衡表示。在每个时间步，CRN构建一个治疗不变表示，它消除了患者历史和治疗分配之间的关联，因此可以可靠地用于做出反事实预测。在一个肿瘤生长的模拟模型上，在不同程度的时间依赖性混杂中，我们展示了我们的模型在估计反事实和选择正确的治疗和治疗时间方面比当前最先进的方法实现了更低的预测误差。

论文地址：https://arxiv.org/pdf/2002.04083.pdf

推荐理由：本文研究了时序中的反事实预测问题，问题设置实用且新颖，具有参考价值。

Hub地址：https://hub.baai.ac.cn/view/12595

标题：NeurIPS21 & UCL｜Causal Effect Inference for Structured Treatments了解详情

简介：本文研究结构化处理(如图表、图像、文本)的条件平均治疗效果(CATEs)的估计。在一个较弱的条件下，我们提出广义Robinson分解，它(i)分离了因果估计(减少正则化偏差)，(ii)允许插入任意模型来学习，(iii)在温和的假设下具有准Oracle收敛保证。在小世界和分子图的实验中，我们证明了我们的方法在CATE估计方面优于之前的工作。

论文地址：https://arxiv.org/pdf/2106.01939.pdf

推荐理由：本文研究了对于有结构化信息的Treatment下的条件平均治疗效果的估计问题，问题设置更难并更加实用。

Hub地址：https://hub.baai.ac.cn/view/12596

社区活动

智源LIVE 第9期 | 陈旭：基于因果推断的推荐算法初探（视频& PPT发布）

12月24日，智源社区线上举办了第9期智源LIVE活动，中国人民大学助理教授陈旭作了题为《基于因果推断的推荐算法初探》的主旨报告。

内容简介：近年来，因果推断受到了机器学习相关研究人员的广泛关注。作为机器学习一个重要的应用场景，推荐系统正深刻的影响着人们的生活和生产。在这次报告中，陈旭着重介绍了如何将因果推断和推荐系统进行结合，并讲解研究人员最近在这个方向上的若干探索。具体来说，本次报告首先介绍了因果推断以及推荐系统的基础知识，其次介绍两个领域相结合的探索工作，最后对现有工作进行了总结，并对未来进行了展望。

视频和PPT：报告回放视频和PPT已经发布，见下面网址：

https://event.baai.ac.cn/activities/222