因果推断（八）有向无环图和do算子

WhyNot?

已于 2023-10-10 20:04:25 修改

阅读量933

点赞数 1

分类专栏：因果推断文章标签：算法笔记

于 2023-10-09 17:42:25 首次发布

本文链接：https://blog.csdn.net/JESSIENOTCAR/article/details/133694763

版权

因果推断专栏收录该内容

10 篇文章

订阅专栏

本文介绍了结构因果模型中，如何通过有向无环图理解变量间的关系。引入do算子后，讨论了干预变量与自然状态下条件分布的区别，强调了干预分布不等于条件分布的概念。通过评分对客流量的例子，阐述了do算子在模拟实际世界干预情况的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

前言

整个因果学科的学习框架之前已经梳理在了学习框架（潜在因果模型和结构因果模型）一文中，本文的内容是结构因果模型（SCM）里一部分。

从有向无环图说起

有向无环图（Directed Acyclic Graph：DAG）里的"有向"代表图里的连线是有箭头表示方向的，“无环”即没有环路，箭头上游是“父亲”，下游是“子代”。

对DAG的理解有两种观点：

是一个条件独立模型；
是一个数据生成机制。

用 $x_i$ 代表图中的节点， $P(x_i)$ 代表连续变量的概率密度函数和离散变量的概率函数，则DAG中随机变量的联合分布可以有如下的分解：
$P(x_1,...,x_i)=\prod_{i=1}^nP(x_i|pa_i)$
$pa_i$ 表示 $x_i$ 的“父亲”集合。

do算子登场

DAG图上引入因果则需要do算子或者干预这一概念。如下图所示，干预意味着处置变量不再受其“父亲”变量的影响，因此一个干预变量不会再有任何一个进入它的有向边。

用一个例子来理解：假设我们想研究评分对一个店铺客流量的影响，do算子或干预意味着，我们人为的把某个店铺的得分修改成t，即 $P(Y|do(X_i=t))$ ，然后观测起客流量的分布。而店铺的 $P(Y|X_i=t)$ 则表示原来用户自由打分的情况下，客流量的分布。
在这里插入图片描述