【文献阅读】Neurosymbolic AI: the 3rd wave

本文链接：https://blog.csdn.net/weixin_43766992/article/details/131064371

【文献阅读】Neurosymbolic AI: the 3rd wave

1介绍
我们重新审视了与形成最新研究的基本相关性的早期理论结果，并确定了在神经网络中的学习和推理的声音表示的瓶颈和最有前途的技术方向。除了指出人工智能、机器学习（ML）和深度学习等各种相关和有前途的技术外，该论文还旨在帮助组织一些围绕AI、ML和DL常用的术语。在这个令人兴奋的时刻，人工智能变得普及，来自计算机科学的其他领域和其他领域的人完全转向人工智能：心理学、认知科学、经济学、医学、工程学和神经科学等等。在整个论文中，当我们提出神经符号人工智能时，我们也将寻求将事实信息与我们的观点分开。我们将通过指出过去20年里重要的理论和实证结果来支持我们的观点，以及我们对菲尔德历史的观察：20世纪80年代的人工智能浪潮是象征性的，基于符号逻辑和逻辑编程，以及后来的贝叶斯网络；2010年代的第二波人工智能是基于深度学习的神经（或连接主义）。经历了这两种浪潮，看到了每种技术的贡献和缺点， 我们认为是第三波人工智能的时候了：神经符号人工智能。

2 当前争论和研究的问题：神经网路 or 逻辑符号？

我们认为，下一步需要研究的是具体的方法和技术，寻求解决问题的表现，鲁棒性和外推。这些方法和技术将从神经符号人工智能、符号ML和DL、知识表示和推理(包含混合系统)的广阔视角来解决：

a）采用混合系统需要研究符号是如何在DL研究人员称之为解纠缠的背景下出现和变得有用的。一旦符号出现，在不同的抽象级别(理想情况下是在模块化网络体系结构中)，从计算的角度来看，引用这些符号并象征性地操作它们(即用它们进行计算)可能会更有效率。

b）常识和组合推理一个关键区别是常识知识和专家知识的区别。前者是近似的，难以具体说明，而后者力求尽可能精确。我们相信，一旦我们对混合系统、变量操作和推理的价值有了坚实的理解，我们的辩论就可以从符号与神经元的问题发展到更精确的研究问题:

如何在神经网络内部或外部使用符号进行计算和学习？
如何在精确或近似的环境下高效地进行计算和推理?

3 神经符号整合形式

训练后的网络和逻辑成为混合系统的通信模块，而不是由网络实现的逻辑计算

提出问题：神经符号AI的基本构件是什么，必要和充分的成分是什么?（例如是否有注意层，网络是否更丰富）

目前清楚的一点是：在分布式表示上使用基于梯度的学习有很大价值

分析：

神经网络可以是局部（离散表示）也可以是分布式（连续值向量表示）

①将符号知识转化为神经网络——编译器（先验知识转化为网络）

②从训练的网络中提取出符号——反编译器

③bengio等人(2020)提出了神经符号集成的第三种形式：它基于将网络的表示转换为因子图（factor graphs），即创建了一种中间表示，在神经网络和逻辑表示之间使用因子图。然而网络和逻辑之间直接转换是有可能的，所有使用因子图没被证明是有用的（可能增加了复杂性）

4 分布式和局部表示

为了实现学习和推理之间的整合，神经符号计算需要在局部表示和分布式表征之间架起一座桥梁。

已有证明：基于梯度方法的分布式表示比基于局部方法的学习更适合于学习和优化

神经符号计算中：推理要么以符号形式，要么以分布式形式。

表征的变化提供了使不同神经模型和架构的价值，是一个更正式和更好理解的研究领域：符号逻辑

神经模型与符号逻辑的集成有望提供一个能够迁移学习的人工智能系统，并在低级信息处理（用于感知感知和模式识别）和高级抽象知识（用于推理、可解释性、外推和规划）之间建立桥梁。

逻辑张量网络（LTN）的两个强大的概念是:

(1)将逻辑概念与张量联系在一起，使用逻辑语句作为向量空间的约束，以帮助学习适当的嵌入

(2)神经网络中知识的模块化和可微分组织，它允许查询和与系统交互。任何用户定义的一阶逻辑语句都可以在LTN中查询，LTN检查训练过的神经网络是否满足该知识。

6 关于术语的注释

6.1 符号ML和深度学习

一旦神经网络被赋予了符号解释，人们就没有理由怀疑神经系统提出“如果”问题的能力

问题：那种表征最有效，深度网络还是贝叶斯网络？

重要的是要认识到神经网络提供了一个由可微学习算法训练的具体计算模型，这个模型与贝叶斯网络不同，可以通过激活的信息传递或传播有效地实现。拥有这样一个具体的计算模型的一个限制可能是纯神经网络在建模丰富的抽象形式方面的困难，这些抽象形式不依赖于数据(图像、音频等)，而是存在于更高的概念层次上。

6.2 知识表示和AI推理

我们主张将统计推理、知识表示和逻辑推理相结合。所谓逻辑推理，不仅指具有传统真假解释的经典逻辑推理，也包括非单调逻辑、模态逻辑和多值逻辑等非经典推理

6.3神经符号分类

通过理解分布式和局部主义方法的作用，我们可以对Henry Kautz的神经符号AI分类法(Kautz 2022)进行分析。在Kautz的分类法中，

第1类神经符号整合是标准的深度学习，其中包括注意到神经网络的输入和输出可以由符号组成，例如语言翻译的文本。

第2类是混合系统，如DeepMind的AlphaGo，以及其他系统，其中核心神经网络与蒙特卡罗树搜索等符号问题求解器松散耦合。

第3类是神经网络聚焦于一项任务(例如，对象检测)，通过其输入和输出与专门从事互补任务(例如，查询回答)的符号系统相互作用的系统。例如神经符号概念学习者(Mao et al. 2019)和deepProbLog (Manhaeve et al. 2018)。

第4类神经符号系统中，符号知识被编译到神经网络的训练集中，例如Arabshahi等人(2019);Lample and Charton (2020);类型4包括紧密耦合的局部系统，其中符号知识的形式被转化为神经网络的初始架构和权重集，在某些情况下保证了正确性(d 'Avila Garcez等人，2009)，例如逻辑神经网络，它在神经元和逻辑公式的元素之间创建了1对1的对应关系(Riegel等人，2020)。

第5类是紧密耦合的分布式神经符号系统，其中符号逻辑规则被映射到网络损失函数上作为软约束(正则化器)的嵌入中。其中包括LTN 逻辑张量网络(Serafini and d 'Avila Garcez 2016);Stehr et al. 2022)和张量积表示(Huang et al. 2017)， d 'Avila Garcez et al.(2019)将其称为张量化方法。

第6类系统应该能够在神经引擎中进行真正的符号推理，被认为是完全集成的系统。神经符号人工智能的早期工作已经实现了这一点(d 'Avila Garcez et al. 2009)。一些第四类系统也有这种能力，但使用的是局部表示和比第五类更简单的嵌入形式。Kautz补充说，6型系统应该能够进行组合推理，可能是通过使用注意力模式来实现的。最近的6型工作包括(Cameron等人，2020年;Lamb等人2020年;Prates等人，2019年)，然而目前还不存在成熟的组合推理6型系统。

对第5类系统的研究将可能集中于提供丰富的嵌入，并研究这种嵌入可能对应于预先定义的先验知识或已习得的注意机制的程度。6型系统的进一步研究将与神经符号计算理论高度相关。在实践中，有效的学习和合理的推理之间存在着一种张力，这可能要求使用一种更混合的3 - 5型方法，或其变体，如使用张紧化的注意力。与上述分类相正交，但迄今为止主要与第4类相关的是对神经网络推理极限的研究。最近，这已经成为符号域DL分析的焦点(Tavares et al. 2020)，在我们看来，这应该包括一阶逻辑和非经典逻辑的研究。

6.4可解释性

神经符号AI至少有两种选择：

选项1，符号被翻译成一个神经网络，试图在网络中执行推理。（需要对网络进行符号描述）

选项2，采用了一种更混合的方法，通过网络与符号系统交互进行推理。（需要一个神经符号接口）

第三种方法，不需要神经符号方法，它存在于专家知识可用的时候，而不是从数据中学习。相比于近似推理，人们更倾向实现精确且合理的推理。

7挑战推理与学习的原则性结合

结论：

(i) 知识应以向量表示为基础，以神经网络信息传递作为一种有效的计算模型，从数据中进行有效学习。

(ii) 从训练有素的网络中查询和提取知识后，符号应该变得可用，并在适当的抽象级别上提供丰富的描述语言，允许无限使用有限的手段，但也可以在符号级别上进行复合推理，允许在数据分布之外进行外推

(iii) 学习和推理的结合应该通过学习减少有效组合的数量，从而产生更简单的符号描述作为神经符号循环的一部分，即将神经网络转换为符号表示，反之亦然，从而为组合推理问题提供了一种替代方案

挑战：

挑战1：从大型网络中提取一阶逻辑和高阶知识，可以证明是合理而有效的，解释了整个模型和局部网络交互，并解释了不同的抽象层次。