EMNLP 2020 | 基于超边融合的文本增强知识图谱开放域问答

最新推荐文章于 2023-05-29 23:23:34 发布

PaperWeekly

最新推荐文章于 2023-05-29 23:23:34 发布

阅读量752

点赞数

文章标签：人工智能知识图谱深度学习自然语言处理计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/c9Yv2cf9I06K2A9E/article/details/114421007

版权

©PaperWeekly 原创 · 作者｜舒意恒

学校｜南京大学硕士生

研究方向｜知识图谱

论文标题：

Open Domain Question Answering based on Text Enhanced Knowledge Graph with Hyperedge Infusion

论文链接：

https://www.aclweb.org/anthology/2020.findings-emnlp.133

摘要

知识库的不完整性是限制知识库问答系统表现的关键因素。在知识库外部，文本拥有比知识库更丰富的信息，可用于弥补知识库的不完整性，但同时文本对于计算机更难理解。

该文提出一种利用文本来增强知识库的新的 QA 方法，模型通过文本中蕴含的语义信息来丰富实体表示，并利用图卷积网络来更新实体状态。

另外，为了探索文本的潜在结构信息，作者将文本视为连接实体的超边，来补充知识库中不完整的关系。超图卷积网络被用于超图形式的文本上的推理。在 WebQuestionSP 基准测试上的实验证明了该模型在不同 KB 上的有效性。

介绍

开放域问答是尝试回答给定自然语言的事实型问题的任务。根据利用的信息源，QA 系统可以分为基于知识的（KBQA）和基于文本的（TBQA）。KBQA 通过结构化的知识库获取答案，易于查询和推理，但是受限于知识库中三元组的不完整性。

TBQA 的信息源是普通文本，包含丰富的语义和潜在的结构信息。但是，对于机器来讲是难以理解的。这种互补的性质启发研究者融合这两种信息，增强不完整的知识库，并进一步提升问答系统的表现。

作者认为当前融合知识库和文本的工作，即使取得了一定表现，文本信息仍然没有被充分利用，特别是文本中实体间的关系信息。图 1 展示了当 KB 不完整时回答问题的一个例子。通过利用文本的结构信息，该问题可以被充分回答。

该文主要介绍了一个新颖的 QA 模型，它基于文本增强的知识图谱，通过文本的语义信息来丰富实体表示，并通过文本中的结构信息补充知识库中的关系。具体来说，模型首先结合文本信息，编码知识库中的实体，并应用图卷积网络在 KB 上进行推理。

注意，一个文档通常包含多个实体，作者利用文本中连接实体的超边，将非结构化的文本转换为结构化的超图，并使用超图卷积神经网络来更新实体状态。最终，模型预测答案。

模型

2.1 任务定义

作者遵循 Sun 等人 [1] 的设定，为每个问题构建一个子图。给定一个问题，相关的子知识库通过 Personlized PageRank 算法抽取，相关的文本语料库通过现有的检索器 [2] 从维基百科中获取。任务要求从所有的知识库和文档实体中提取答案。模型的概览如图 2 所示。

即如何查找知识库的子图，以及从维基百科中检索相关文档，并非本文的重点。

2.2 输入编码器

输入编码器包含对查询、文本和 KB 的编码。

查询和文本编码器：双向 LSTM 网络被用于分别编码查询和文档，并获取隐藏状态。然后，通过注意力机制计算查询和文档的表示。

KB 编码器：每个实体通过预训练的知识图谱嵌入

最低0.47元/天解锁文章

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
EMNLP 2020 | 基于超边融合的文本增强知识图谱开放域问答

©PaperWeekly 原创 ·作者｜舒意恒学校｜南京大学硕士生研究方向｜知识图谱论文标题：Open Domain Question Answering based on Text E...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。