认知智能是人工智能发展的最高阶段,其目标是让机器掌握人类的语言和知识体系,并真正理解其内在逻辑,这意味着机器开始具备分析和思考的能力。自然语言是认知科学的一项重要研究内容,用自然语言与计算机进行通信,意味着要使计算机能够理解自然语言文本的意义,以自然语言理解为核心技术的自动问答、人机对话、聊天机器人已经成为产业界和学术界的关注热点。
自动问答是语言理解的重要应用领域,特别是机器阅读理解,赋予了计算机从文本数据中获取知识和回答问题的能力,它是人工智能中一项挑战性的任务,需要深度理解自然语言并具备一定推理能力。
近年来,机器阅读理解领域的研究进入快速发展时期,一方面得益于大规模高质量数据集的发布:包括Facebook Children’s Books Test[1]、SQuAD[2]以及TriviaQA[3]等高质量数据集;另一方面,基于深度学习技术的模型在获取上下文交互信息方面明显优于传统模型,例如基于双向注意力机制的BiDAF模型[4]、Transformer[5]和基于注意力机制的循环神经网络R-Net[6]。中文问答任务上,基于注意力机制的模型如N-Reader[7]在中文数据集DuReader[8]上取得了较好的成绩。
近期,预训练模型[9-10]与知识推理技术[11-12]在复杂问答任务上取得了优异的表现,特别在多跳问答任务中,问题的答案需要从多个篇章中获取,模型需要通过推理才能得出答案,图神经网络在该类任务上具有较好的适用性,Ding等[11]使用认知图谱与