“神经+符号”:从知识图谱角度看认知推理的发展
在过去十年的人工智能浪潮中,以深度学习为代表的人工智能技术已基本实现了视觉、听觉等感知智能,但依然无法很好地做到思考、推理等认知智能。因此,具有推理、可解释性等能力的认知智能研究毫无疑问将越来越受到重视,成为未来人工智能领域重要的发展方向之一。
研究人员的嗅觉无疑是最敏锐的。例如,ACM图灵奖获得者约书亚·本吉奥(Yoshua Bengio)在NeuIPS 2019的特邀报告中明确提到,深度学习需要从系统1(System 1)到系统2(System 2)转化。注:这里所说的System 1和System 2是指认知科学中的双通道理论,其中System 1表示直觉的、快速的、无意识的、非语言的、习惯的认知系统,这也是目前深度学习技术擅长的事情;System 2则表示慢的、有逻辑的、有序的、有意识的、可用语言表达以及可推理的系统,这是未来深度学习需要着重考虑的研究方向。
1
神经系统和符号系统的特点
从更宏观的角度来看人工智能,System 1对应的是神经(Neural)学派, System 2则对应符号(Symbolic)学派,Bengio所提的System 2关于深度学习的想法与“神经+符号”的人工智能目标基本一致。沿着这一点追溯,我们可以发现另一位ACM图灵奖得主马文·明斯基(Marvin Minsky)早于1986年在《心智社会》(The Society of Mind)一书中就清楚地阐述了人工智能和认知心理学(即System 1和System 2)之间的关系,并深入分析了人工智能中的神经系统和符号系统各自的特点和结合的可能,如图1所示。从宏观再到具体,以数据的对象、存储以及应用来说,无论是神经系统还是符号系统,数据建模的目的都是求解给定输入问题的答案,如图2所示。但不同之处在于,神经系统擅长处理非结构化的数据(如文本等)。目前的主流模型以端到端为主,常见的应用场景有机器翻译、语音识别、简单问题智能问答(如,姚明的身高是多少?)等;而符号系统主要以结构化的数据库为主,且通常支持结构化的查询、推理引擎等,能够实现复杂问题的求解(如,美国是农业出口大国,为什么还要进口咖啡?)。值得一提的是,ACM图灵奖获得者莱斯利·瓦利安特(Leslie Valiant)曾精辟地指出:神经系统侧重对数据特征的学习过程,而符号系统包含的一定是一个搜索过程,后续大量面向符号系统的研究本质上致力于各种高效的搜索算法。神经系统和符号系统各自的特点还可以通过两个计算机视觉领域应用中的例子来体会:图3(a)的例子表示经典的手写体识别,对于给定可观察的手写数字和比较符样本集合,在经过训练后,大量神经系统的模型可以很好地识别各类手写体(即视觉层次的泛化认知能力),但却很难实现符号知识的认知泛化(即对于未出现在训练样本中的比较符样例,难以进行求解判断)。同样,在图3(b)的视觉问答例子中,神经系统可以轻松应对简单的视觉问答场景(如,图中有几只长颈鹿?),但是如果需要回答更复杂的问题(如,图中动物和斑马有哪些共同属性?),则必须借助外部的符号知识&