学习笔记:类人归纳偏置在因果推理与分布外泛化的应用

本文探讨了如何借鉴人类的归纳偏置,尤其是系统1和系统2的认知,来提升机器学习模型在因果推理和分布外泛化的能力。介绍了全局工作台理论、隐含知识与可言传知识的区别,并从编程语言的角度提供了启示。
摘要由CSDN通过智能技术生成

学习笔记:类人归纳偏置在因果推理与分布外泛化的应用(Human-Inspired Inductive Biases for Causal Reasoning and Out-of-Distribution Generalization)

在2021年4月举行的NVIDIA线上GTC大会上,约书亚*本希奥(Yoshua Bengio)对他最近的论文"高阶认知深度学习中的归纳偏置"(arxiv: 2011.15091)做了一个讲解。我们现将部分要点整理如下。
Yoshua Bengio

今天的机器学习模型中存在一个假设:未来的观察数据与训练模型所用的数据出自同一个分布,且样本之间遵循独立相同分布(Independently Identically Distributed, i.i.d.)的限制。真实世界中,新的观察数据往往来自不同的分布,这些差异的来源可能是一些变量本质上不同,或是同一个变量的分布不具有时间静止性(temporal non-stationarity)。这时,便没有理由期望模型在不经过调整的情况下获得良好的表现。而我们通常认为智慧的一个标志,就是对分布外数据的泛化能力。人类和其它高等生物的大脑,似乎对适应新的情形有着与生俱来的天分。用算法捕捉这种天分,是从业人员梦寐以求的目标。从贝叶斯的视角来看,一个人的历史体验能够有效地为当下的判断提供先验知识。尽管这样做出的判断不能保证百分之百的正确,它是在信息不完备条件下最佳的预测,长远来说往往也代表着最优的生存策略。这种先验知识实际上也是一种偏置(bias),而它的不确定性给了它归纳(induction)的名字,所以说此类研究的目标是通过观察人类大脑的工作方式,试图从中获取灵感,以设计出具备相似的归纳偏置的机器学习方法。

系统1/2认知

Bengio指出,人类在接触新事物时,会有意识地重新组合生活常识,进行推理和想象。这种思维模式有别于“下意识”的思维模式,也就是目前的神经网络试图效法的模式。这两种思维模式被Daniel Kahneman称为系统1和系统2:

  • 系统1
    • 直觉、快速、下意识地、一步并行、非语言的、习惯性
    • 隐含知识
    • 当前深度学习
  • 系统2
    • 缓慢、逻
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值