『The Book of Why』导言:思维胜于数据

前言

由于研究方向的缘故接触到了Judea Pearl老爷子的这本书,其中一些极具启发性的内容,让我感觉到即使不用于学术研究,对日常生活或许也有所裨益。书籍的写作虽尽量做到通俗,但由于内容稍有门槛,却也不能说是易懂,为了更好地吸收这些知识,遂以阅读笔记的形式记录下来。



本书的内容将会围绕着一门新科学展开,它的名字是“因果推断(causal inference)”。

在这个大数据、深度学习所主导的强人工智能时代,以数据为中心的观念深入人心,仿佛只要有充足的数据便足以解决所有问题。

目前自然语言处理领域愈发巨大的预训练模型,便是这种观念的一种具象化。爆炸式增长的参数量,超大规模的语料,然而 数据真的是万能的吗?

数据可以告诉我们服药的病人比不服药的病人康复得更快,但是却不能告诉我们为什么会这样。或许,服药的人选择吃这种药是因为他们支付得起,即使不服用这种药,照样能恢复得这么快。

因果关系,是我们认知世界的一种重要方式,模型仅仅依靠海量数据真的可以像人类一样去理解世界吗?对此我持怀疑态度。

这也是本书作者想要强调的为什么因果关系如此重要的原因,所谓“思维胜于数据”,利用数据终究只是找规律,真正重要的是其背后的思维。


关于因果的数学语言

作者认为,阻碍因果推断这一科学诞生的最大障碍,是我们用以提出因果问题的词汇和我们用以交流科学理论的传统词汇之间的鸿沟。

比如,气压计读数B与实际大气压P的关系可以用方程式 B = k P B=kP B=kP表示。三个变量中的任意一个在数学上都没有凌驾于其他两个之上的特权。那么我们该如何表达“大气压的变化导致气压计读数的变化”这一确凿的事实?这正是科学家们在尝试表达一些明显的因果关系时所面临的困难。

每一门蒸蒸日上的科学都是在其符号系统的基础上繁荣发展起来的。

此前的我们无法在科学的范围内找到途径明确地表述这些因果关系,没法用数学与公式去描述这些显而易见的事实。

因果推断这门新科学的贡献就在于催生出了一种简单的数学语言,用以表达我们已知和欲知的因果关系


因果关系演算法

因果推断的数学工具名为“因果关系演算法”,其由两种语言组成。

  • 其一为因果图(causal diagrams),用以表达我们已知的事物。

因果图并非唯一的因果模型,这些因果模型都用于描述在环境中控制并塑造数据生成的因果力量(描述出数据的生成过程)。

  • 其二为类似代数的符号语言,用以表达我们想知道的事物。

这种符号式的问题语言,用于表述想要回答的问题。例如,如果想要知道药物D对病人生存期L的影响,可以写作 P ( L ∣ d o ( D ) ) P(L | do(D)) P(Ldo(D)),此处的do算子表明我们正在进行主动干预而非被动观察,这一概念是经典统计学所无法涉及的。

这里所调用的干预算子 d o ( D ) do(D) do(D),确保观察到的病人存活期L的变化能完全归因于药物本身,而没有混杂其他影响寿命长短的因素。

在数学上,自愿服药的病人生存期L的观测频率记作 P ( L ∣ D ) P(L | D) P(LD),这就是统计学教科书中常用的条件概率。但观察到(seeing)与进行干预(doing)有着本质的区别,它解释了我们不认为气压计读数下降是风暴来临的原因。观察到气压计读数下降意味着风暴来临的概率增加,但人为迫使气压计读数下降对风暴来临的概率并不会产生影响。

作者再次强调,对观察和干预的混淆是悖论之源

因果革命最重要的成果之一就是解释了如何在不实际实施干预的情况下预测干预的效果:定义do算子以便提出正确的问题;使用一种无需实际实施干预便可模拟干预行动的表达方式,这种表达方式是因果推断科学独有的,称为"反事实"(counterfactual)。

作者在20世纪80年代时意识到,妨碍机器发展出相当于人类水平的智能的最大障碍,可能是缺乏对因果关系的理解。这也成为了他研究因果关系的一大动力。


因果推断引擎

作者在这部分提出来了一个因果推断引擎的蓝图,描述了人工智能进行因果推理的过程。

由于这是一个些许复杂的流程,且涉及很多必要的说明,此处便不再复述,只摘取对我有启发意义的部分语句。

关于数据的一个真相:数据永远是从理论上无限的总体中抽取的有限样本

而深度学习的目标便是从有限的样本泛化到无限的总体。

作者认为,对于因果关系方面的知识来说,数据没有任何发言权。有关行动或干预结果的信息根本无法从原始数据中获得,这些信息只能从对照实验操作中收集。

因果模型所具备,而数据挖掘和深度学习所缺乏的另一个优势是 适应性,被估量是在检查数据特性之前仅仅根据因果模型计算出来的,无论变量之间的数值关系如何,都适用于与定性模型适配的数据。




以上,便是我对本书导言部分的摘录+个人总结。

个人认为,在深度学习中,我们设计模型、算法等均是一个融入人类先验知识的过程,我们让模型在一定先验知识的辅佐下从数据中发现规律,解决问题。比如由于语言变长序列的特性,我们使用RNN而不是CNN处理语言。但是这种先验知识强度有限,无法囊括我们对世界的所有认知。

而因果关系作为我们认知世界最重要的方式之一,很多时候单从数据上难以挖掘得到。这时候便会很自然的想到将因果关系使用数学语言表达,作为一种更强的先验知识融入到深度学习模型之中,这极有可能是迈向强人工智能的重要阶梯。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值