Pearl教授被称为“贝叶斯网络之父”,足以显示他对贝叶斯网络研究的贡献(虽然他好像并不是贝叶斯网络的最初提出者)。但正如他自己所说,他曾经一度认为贝叶斯网络是开启人工智能大门的金钥匙,直到他发现自己错了,于是提出了更加符合因果关系研究的因果图模型。尽管如此,贝叶斯网络仍然是人工智能领域的重要工具,仍然在各行各业成功地应用,其中的数学基础也与因果图一脉相承。因此,在介绍因果图之前,本文先介绍贝叶斯网络这种有用的工具,并指出它为什么不能反应因果关系的原因。
贝叶斯网络
贝叶斯网络(Bayesian Network),也被称为信念网络(Belief Network),是一种典型的“概率图模型”(Probabilistic Graphical Model, PGM),是一种用图形化的方式来表达事件之间的相互依赖关系的方法(注意,这里没有说因果关系!)。
贝叶斯网络的基本结构是一个有向无环图(Directed Acyclic Graph, DAG),由节点(nodes)和节点之间带有单向箭头的连线组成。下图给出了一个两个变量组成的最简单的有向无环图。为了后续描述方便,这里先定义一些基本的术语:
- 节点(nodes/vertices/variables):就是图中的变量 A 和 B 。
- 边(link/edge):就是图中单方向的箭头,这表明变量 A 和 B 之间存在方向。
- 路径(path):就是从一个变量沿着箭头的方向抵达另一个变量的经过。图1中只有一条路径就是 A→B 。
图1:两节点的有向无环图
这些概念很好理解。图中每一个节点都代表一个变量。从节点 A 指向节点 B 的箭头表示变量 B 依赖于变量 A ,且变量A是变量B的父节点(parent node),变量B是变量 A 的子节点(child node)。这里的变量既可以是离散的,也可以是连续的。对于离散的情况,可以把变量想成事件,变量可以取的几种值就是事件发生的几种情况。对于连续的情况,可以想象成某个事件发生的程度,或者某个特征的定量描述。
从任意起点开始,沿着箭头的方向转移到下一节点,以此类推下去,一定不会回到起始节点,这就是有向但无环的含义。下图给出了一种由四个变量构成的有向无环图的例子。在这个例子中, x1 和 x3 是 x2 的父节点, x4 是 x3 和 x2 的子节点。从 x3 到 x4 有两条路径,分别是 x3→x4 和 x3→x2→x4 。