©PaperWeekly 原创 · 作者|舒意恒
学校|南京大学硕士生
研究方向|知识图谱
导读
本文讨论知识库问答(KBQA)中查询图生成的强化学习方法。给定一个自然语言问题,知识库问答尝试自动从存储有实体间关系的知识库中获取答案。对于一个复杂问题,查询图生成是一种常见的基于语义解析的方法。其中,查询图指对问题的一种抽象的图表示。
作者认为现有方法通常依赖有限的规则,使得他们无力应对更加复杂的问题。该文提出一个类似于”导演-演员-影评者“的框架,以克服这一问题。其中,导演决定查询图需要的三元组类型,演员通过选择结点和边生成相应的三元组,影评者计算生成的三元组和给定问题之间的相似度。
通常,知识库问答的监督信息仅主要包括自然语言问题及其在知识库中的答案,而多步骤的查询图生成方法难以在中间过程的每步中都包含监督信息,它通常是弱监督的。因此,作者将该算法框架置于分层的强化学习之上。
论文标题:
Hierarchical Query Graph Generation for Complex Question Answering over Knowledge Graph
论文链接:
http://www.bigdatalab.ac.cn/~jinxiaolong/publications/CIKM2020QiuZ.pdf
方法
2.1 查询图
查询图是用于图表示的一类特定的 λ-演算,可以被翻译为可执行查询语言,例如 SPARQL。在作者设计的查询图中,三元组被分为五种类型:
基础(basic):三元组的边是 KG 中的谓词(关系),三元组头尾实体是 KG 中的结点(链接或未链接到知识库)
合并(union):边同样是 KG 中的谓词,但其中两个结点可以被超过一条边相连,三元组之间通过 逻辑或 相连
过滤(filter):数值或时间比较,包括 <, ≤, >, ≥, =, ≠ 等关系
序数(ordinal):头实体需要被排序,边表示排序是升序或降序
聚合(aggregation):边表示聚合函数,包括 count、limit 等
通过这几类三元组,生成的查询图具有基本的处理排序、计数等问题的能力。后文所提到的“选项”,即模型选择这些三元组类别中的一种进行生成。
2.2 “导演-演员-影评者”框架
强化学习的常见形式是马尔科夫决策过程(MDP),它是智能体(agent)与环境(environment)的交互过程。其中,智能体是学习者和决策者,环境包含了智能体之外的所有元素。
由于知识库是由三元组组成的这一特性,作者将查询图生成描述为关于选项(option)的 MDP,每一个选项表示生成对应类型的三元组。不同于传统的 MDP,通过选项,智能体能够一次选择多步动作。
该框架包含三个模块,作者将它们比喻为“导演”、“演员”和“影评者”:
导演根据当前状态 ,选择一个选项 ,确定何种类型的三元组是需要的。
演员根据当前状态 和选项 ,选择一个动作