知识图谱/知识库问答论文整理(含可用代码、数据集)
近期开始涉猎知识库问答,这会是我第二篇论文的起始点,同时也将会是我的毕业设计。 因此,对知识库问答的相关论文进行了初步的整理,主要来自近两年的ACL、AAAI、EMNLP、IJCAI等顶会的论文,进一步的,我专门挑了有公开代码和数据集的论文放上来。同时本人尝试从这些论文里找突破口,有意者可以多多学习交流~
1、Improving Multi-hop Question Answering over Knowledge Graphs using knowledge base embedding (2020 ACL) [code]
KG由于一些缺失的链接(missing links)而成为不完整的KG,给多跳(multi-hop )KGQA带来巨大挑战。已有研究利用知识图嵌入(KB Embeddings)对缺失的链接进行预测,以缓解KG稀疏性。但是这些研究并没有直接针对多跳问题的缺陷,对此,提出EmbedKGQA模型,利用KG嵌入来解决多条问答。
实验取得SOTA的表明,表明该方案可利用KG嵌入的链接预测属性(link prediction properties)缓解KG不完整性带来的问题。
2、Query Graph Generation for Answering Multi-hop Complex Questions_ from Knowledge Bases (2020 ACL) [code]
针对以往KBQA在复杂问题的解决上通常将“问题约束(constraints)”和“问题多跳(multi-hop)关系”分开解决的现象,提出了一种改进的分级查询图生成方法。
具体地,在建立关系路径的同时加入约束和扩展关系路径,而不是只在建立关系路径之后再添加约束。
实验结果表明,在三个QA数据集上取得SOTA的表现。
3、Improving Knowledge-aware Dialogue Generation via Knowledge Base Question Answering (2020AAAI) [code]
将常识引入开放域对话系统仍是神经网络方案的一个挑战。
对此,提出创新的知识感知对话生成模型(TransDG),该模型将知识库问答任务中的问题表示和知识匹配能力转化为有利于对话生成的话语理解和事实知识选择。此外,还提出回复导向注意力和多步解码策略,以此引导模型专注于问题生成的相关特征上。
值得注意的是,此篇工作本质是生成更具“感知力”的话语,并非直接从知识库得到答案作为结果。
因此其评估指标为“perplexity困惑度”和“BLEU”
4、SPARQA: Skeleton-Based Semantic Parsing for Complex Questions over Knowledge Bases (2020AAAI) [code]
如今KBQA的语义解析方法多依赖于"syntactic parse语法解析",这对于长而复杂的问题(question)来说不足应对。
对此,提出一种新型的语法框架来表示复杂问题的高级结构(high-level
structure)。这是一种结合了bert解析算法的粗粒度表达方式,具有轻量化的特点。然后,为对齐(alight)问题(解析)结构,提出结合了句子粒度和词粒度级别的语义得分的多策略方法来对最终的查询进行排名(rank)。
5、Formal Query Building with Query Structure Prediction for Complex Question Answering over Knowledge Base (2020 IJCAI) [code]
形式化查询构建(Formal query building)是KBQA的重要部分。最近的方案多以状态转移策略(state-transition strategy)对候选查询进行排序。
然而&#x