『The Book of Why』导言：思维胜于数据

最新推荐文章于 2023-09-28 16:01:34 发布

Hoshino Ren

最新推荐文章于 2023-09-28 16:01:34 发布

阅读量667

点赞数

分类专栏： # The Book of Why 文章标签：自然语言处理人工智能深度学习

本文链接：https://blog.csdn.net/weixin_41300383/article/details/122311506

版权

The Book of Why 专栏收录该内容

1 篇文章

订阅专栏

本文探讨了Judea Pearl的著作《因果推断》中的核心思想，强调在大数据和深度学习时代，单纯依赖数据不足以理解世界的因果关系。因果推断提供了一种数学语言和算法来表达和探索因果关系，如do算子用于区分观察和干预。作者指出，因果关系的理解是机器智能发展的重要障碍，并提出了因果推断引擎的概念，强调了因果模型在适应性和预测干预效果方面的能力。深度学习虽然依赖数据，但在因果关系挖掘上存在局限，将因果关系融入模型可能推动人工智能的进步。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

前言

由于研究方向的缘故接触到了Judea Pearl老爷子的这本书，其中一些极具启发性的内容，让我感觉到即使不用于学术研究，对日常生活或许也有所裨益。书籍的写作虽尽量做到通俗，但由于内容稍有门槛，却也不能说是易懂，为了更好地吸收这些知识，遂以阅读笔记的形式记录下来。

本书的内容将会围绕着一门新科学展开，它的名字是“因果推断（causal inference）”。

在这个大数据、深度学习所主导的强人工智能时代，以数据为中心的观念深入人心，仿佛只要有充足的数据便足以解决所有问题。

目前自然语言处理领域愈发巨大的预训练模型，便是这种观念的一种具象化。爆炸式增长的参数量，超大规模的语料，然而数据真的是万能的吗？

数据可以告诉我们服药的病人比不服药的病人康复得更快，但是却不能告诉我们为什么会这样。或许，服药的人选择吃这种药是因为他们支付得起，即使不服用这种药，照样能恢复得这么快。

因果关系，是我们认知世界的一种重要方式，模型仅仅依靠海量数据真的可以像人类一样去理解世界吗？对此我持怀疑态度。

这也是本书作者想要强调的为什么因果关系如此重要的原因，所谓“思维胜于数据”，利用数据终究只是找规律，真正重要的是其背后的思维。

关于因果的数学语言

作者认为，阻碍因果推断这一科学诞生的最大障碍，是我们用以提出因果问题的词汇和我们用以交流科学理论的传统词汇之间的鸿沟。

比如，气压计读数B与实际大气压P的关系可以用方程式 $B = k P$ 表示。三个变量中的任意一个在数学上都没有凌驾于其他两个之上的特权。那么我们该如何表达“大气压的变化导致气压计读数的变化”这一确凿的事实？这正是科学家们在尝试表达一些明显的因果关系时所面临的困难。

每一门蒸蒸日上的科学都是在其符号系统的基础上繁荣发展起来的。

此前的我们无法在科学的范围内找到途径明确地表述这些因果关系，没法用数学与公式去描述这些显而易见的事实。

因果推断这门新科学的贡献就在于催生出了一种简单的数学语言，用以表达我们已知和欲知的因果关系。

因果关系演算法

因果推断的数学工具名为“因果关系演算法”，其由两种语言组成。

其一为因果图(causal diagrams)，用以表达我们已知的事物。

因果图并非唯一的因果模型，这些因果模型都用于描述在环境中控制并塑造数据生成的因果力量（描述出数据的生成过程）。

其二为类似代数的符号语言，用以表达我们想知道的事物。

这种符号式的问题语言，用于表述想要回答的问题。例如，如果想要知道药物D对病人生存期L的影响，可以写作 $P (L ∣ d o (D))$ ，此处的do算子表明我们正在进行主动干预而非被动观察，这一概念是经典统计学所无法涉及的。

这里所调用的干预算子 $d o (D)$ ，确保观察到的病人存活期L的变化能完全归因于药物本身，而没有混杂其他影响寿命长短的因素。

在数学上，自愿服药的病人生存期L的观测频率记作 $P (L ∣ D)$ ，这就是统计学教科书中常用的条件概率。但观察到(seeing)与进行干预(doing)有着本质的区别，它解释了我们不认为气压计读数下降是风暴来临的原因。观察到气压计读数下降意味着风暴来临的概率增加，但人为迫使气压计读数下降对风暴来临的概率并不会产生影响。

作者再次强调，对观察和干预的混淆是悖论之源。

因果革命最重要的成果之一就是解释了如何在不实际实施干预的情况下预测干预的效果：定义do算子以便提出正确的问题；使用一种无需实际实施干预便可模拟干预行动的表达方式，这种表达方式是因果推断科学独有的，称为"反事实"(counterfactual)。

作者在20世纪80年代时意识到，妨碍机器发展出相当于人类水平的智能的最大障碍，可能是缺乏对因果关系的理解。这也成为了他研究因果关系的一大动力。