《因果学习周刊》第10期：ICLR2022中最新Causal Discovery相关论文介绍

智源社区

于 2022-03-14 14:17:29 发布

阅读量612

点赞数 2

文章标签：算法大数据 python 机器学习人工智能

原文链接：https://mp.weixin.qq.com/s?__biz=MzU5ODg0MTAwMw==&mid=2247519593&idx=3&sn=f994eaae83a9348b34d26d37d985b6b6&chksm=febcceadc9cb47bb27d68fe5a2b42b66718cdb5f514fb36932242206730dd4d24464929f9f2a&scene=126&&sessionid=0

版权

No.10

智源社区

因果学习组

因

果

学

习

研究

观点

资源

活动

关于周刊

因果学习作为人工智能领域研究热点之一，其研究进展与成果也引发了众多关注。为帮助研究与工程人员了解该领域的相关进展和资讯，智源社区结合领域内容，撰写了第10期《因果学习周刊》。

本期周刊总结了刚刚放榜的ICLR22中涉及到的一些因果结构学习的文章，论文整体价值较高，对一些传统的基础的问题有了一些新的突破，例如可有环的因果结构学习、因果图的可微分抽样等，都是传统贝叶斯因果网络无法解决的问题，这些文章也向前推进了一步，值得学习和借鉴！

周刊采用社区协作的模式产生，欢迎感兴趣的朋友们参与我们的工作，一起来推动因果学习社群的分享、学习和交流活动。可以扫描文末的二维码加入因果学习社区群。

告诉大家一个好消息，《因果学习周刊》已经开启“订阅功能”，以后我们会向您自动推送最新版的《因果学习周刊》。订阅方法：请点击本文下方的“阅读原文”，进入《因果学习周刊》Hub社区版，点击作者栏“因果学习周刊”后选择“关注TA”。(注：《因果学习周刊》Hub社区版内有详细的订阅步骤图示介绍)。

本期贡献者：刘家硕

论文推荐

标题：ICLR22 | OPTIMAL TRANSPORT FOR CAUSAL DISCOVERY了解详情

简介：基于功能因果模型(Functional Causal Models)的方法，通过适当限制模型类别来确定两个变量之间的因果方向，然而，它们的性能对模型假设很敏感，这使得从业者很难使用。在这篇论文中，我们提供了FCM的一个新的动力学系统视图，并提出了一个新的框架来识别二元情况下的因果方向。首先给出了FCM与最优运输之间的联系，然后研究了FCM约束下的最优运输问题。此外，利用FCM约束下的最佳输运的动力学解释，我们确定了在最小作用原理下静态因果对数据的相应动态过程。它为描述静态因果关系提供了一个新的维度，同时也为定量因果关系的建模提供了更多的自由度。特别地，我们证明了加性噪声模型(ANMs)对应于体积保持无压流动。因此，基于它们的速度场散度，我们引入了一个判断因果方向的判据。在此基础上，我们提出了一种新的基于最优传输的自适应模型选择算法，该算法对模型的选择具有鲁棒性，并将其推广到后非线性模型。我们的方法在模拟和真实因果发现基准数据集上达到了很好的效果。

论文地址：https://arxiv.org/abs/2201.09366

标题：ICLR22 & 中科大｜Discovering Invariant Rationales for Graph Neural Networks了解详情

简介：图神经网络的内在可解释性是找到输入图的一个小子图的特征来指导模型预测。不幸的是，主流的方法往往依赖于数据偏差，特别是快捷特征，来构建基本原理和做出预测，而没有探究关键的因果模式。此外，这些数据偏差很容易在训练分布之外改变。因此，这些模型在非分布数据上的可解释性和预测性能都有很大的下降。在这项工作中，我们提出了一种新的发现不变原理的策略来构造本质可解释的GNN。它对训练分布进行干预，以创建多个干预分布。然后，类似于因果原理，在不同的分布是不变的，同时过滤掉不稳定的虚假模式。在合成数据集和真实数据集上的实验验证了该方法在图分类的可解释性和泛化能力方面的优越性。

推荐亮点：本文将不变性性质引入到了图神经网络中，使得模型对于数据偏差有着很好的抵御作用，值得推荐。

论文地址：http://arxiv.org/abs/2201.12872

代码：https://github.com/Wuyxin/DIR-GNN

标题：ICLR22 & 阿姆斯特丹大学｜EFFICIENT NEURAL CAUSAL DISCOVERY WITHOUT ACYCLICITY CONSTRAINTS了解详情

简介：在许多科学领域中，使用观察和介入数据学习因果图形模型的结构是一个基本问题。一个很有前途的方向是对基于分数的方法进行持续优化，这种方法以数据驱动的方式有效地学习因果图。然而，到目前为止，这些方法需要约束优化来加强无环性或缺乏收敛保证。在本文中，我们提出了ENCO，一种有效的结构学习方法，利用观测和干预数据，用于有向、无环因果图。ENCO将图搜索定义为一种独立边缘可能性的优化，边缘方向被建模为一个单独的参数。因此，我们可以在温和的条件下提供ENCO的收敛保证，而无需对评分函数进行无环性约束。在实验中，我们证明了ENCO能够有效地恢复具有数百个节点的图，这比以前的可能性要大一个数量级，能够同时处理确定性变量和潜在的混杂因素。

推荐亮点：无环约束是causal discovery中十分重要的约束，同样也是限制大规模应用的一个约束，本文提出了不需要无环约束下的causal discovery方法，对于整个领域的发展有着很重要的意义。

论文地址：http://arxiv.org/abs/2107.10483

标题：ICLR22 | Learning Causal Relationships from Conditional Moment Conditions by Importance Weighting了解详情

简介：我们考虑在条件时刻条件下学习因果关系。与无条件时刻条件下的因果推断不同，条件时刻条件对因果推断提出了严峻的挑战，特别是在复杂的高维环境中。为了解决这一问题，我们提出了一种方法，通过使用条件密度比的重要性加权，将条件矩条件转换为无条件矩条件。然后，利用这种变换，我们提出了一种近似条件矩条件的方法。我们提出的方法允许我们以直接的方式从无条件矩条件估计因果参数，如广义矩方法。实验结果表明，与现有方法相比，本文提出的方法具有较好的性能。

论文地址：http://arxiv.org/abs/2108.01312

标题：ICLR22｜GeneDisco: A Benchmark for Experimental Design in Drug Discovery了解详情

简介：利用基因干预的体外细胞实验，例如使用CRISPR技术，是早期药物发现和目标验证的重要步骤，有助于评估关于生物机制和疾病病理之间因果关系的初步假设。由于有数十亿个潜在的假设需要检验，试管基因实验的实验设计空间是极其广阔的，可用的实验能力——即使是世界上最大的研究机构——与这一生物学假设空间的大小相比也相形见绌。机器学习方法，如主动学习和强化学习，可以通过整合来自不同信息源的先验知识，以及基于现有数据推断尚未探索的实验设计领域，从而帮助优化探索广阔的生物空间。然而，这一具有挑战性的任务并没有标准化的基准和数据集，迄今为止在这一领域进行的研究也很少。在这里，我们介绍GeneDisco，一个用于评估药物发现中实验设计的主动学习算法的基准套件。GeneDisco包含多个公开可用的实验数据集，以及用于实验设计和探索的最先进的主动学习政策的开源实现。

推荐亮点：本文为药物发现领域提供了一个很好的公开数据集，对于领域的研究有很大的意义。

论文地址：http://arxiv.org/abs/2110.11875

标题：ICLR22｜DIFFERENTIABLE DAG SAMPLING了解详情

简介：我们提出了一个新的可微概率模型(DP-DAG)。DP- DAG允许快速和可微分的DAG采样适合于连续优化。为此，DP-DAG对DAG进行采样，方法是依次(1)对节点进行线性排序采样，(2)对与采样线性排序一致的边进行采样。我们进一步提出了VI-DP-DAG，一种将DP-DAG与变分推理相结合的观测数据DAG学习新方法。因此，VI-DP-DAG近似于给定观测数据的DAG边的后验概率。与现有的可微分DAG学习方法相比，VI-DP-DAG保证在训练过程中随时输出有效的DAG，并且不需要任何复杂的增广拉格朗日优化方案。在我们广泛的实验中，我们在合成和真实数据集上比较了VI-DP-DAG和其他可微分DAG学习基线。VI-DP-DAG显著改善了DAG结构和因果机制学习，且训练速度快于竞争对手。

论文地址：https://openreview.net/pdf?id=9wOQOgNe-w

标题：ICLR22｜GRANGER CAUSAL INFERENCE ON DAGS IDENTIFIES GENOMIC LOCI REGULATING TRANSCRIPTION了解详情

简介：当一个动态系统可以被建模为一个观察序列时，格兰杰因果关系是一个强有力的方法来检测变量之间的预测交互作用。然而，传统的Granger因果推理在需要以有向无环图(dag)而不是以线性序列(如细胞分化轨迹)表示动态的领域中应用有限。本文提出了一种基于滞后消息传递的图神经网络的GrID-Net框架，用于对DAG结构系统进行Granger因果推理。我们的激励应用是分析单细胞多模态数据，以确定介导特定基因调控的基因组位点。据我们所知，GrID-Net是第一个单细胞分析工具，它解释了基因组位点变得可接近和它对目标基因表达的下游影响之间的时间延迟。我们将GrID-Net应用于同一细胞中染色质可达性(ATAC-seq)和基因表达(RNA-seq)的多模态单细胞分析，结果表明，该方法在推断调控位点-基因连接方面显著优于现有方法，与基于独立群体遗传学的估计的一致性提高了71%。与其他方法相比，GrID-Net鉴定出的基因座富集的转录因子结合基序也多10 - 50倍。通过将格兰杰因果关系扩展到DAG结构的动力系统，我们的工作为因果分析打开了新的领域，更具体地说，以前所未有的规模和分辨率，为阐明与细胞分化和复杂人类疾病相关的基因调控相互作用打开了一条道路。

论文地址：https://openreview.net/pdf?id=nZOUYEN6Wvy

Hub地址：https://hub.baai.ac.cn/view/15238

如果你正在从事或关注因果学习研究、实现与应用，欢迎加入“智源社区-因果学习-交流群”。在这里，你可以：

学习前沿知识、求解疑难困惑
分享经验心得、展示风貌才华
参与专属活动、结识研究伙伴

扫描下方二维码，加入因果学习兴趣群。

智源社区

关注

2
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
《因果学习周刊》第10期：ICLR2022中最新Causal Discovery相关论文介绍

No.10智源社区因果学习组因果学习研究观点资源活动关于周刊因果学习作为人工智能领域研究热点之一，其研究进展与成果也引发了众多关注。为帮助研究与工程人员了解该领域的相关进展和资讯，智源社...
复制链接

扫一扫