《PullNet：迭代检索知识图谱和文本语料进行开放域问答》论文嚼读

最新推荐文章于 2024-09-15 07:39:58 发布

Lijuce

最新推荐文章于 2024-09-15 07:39:58 发布

阅读量2.1k

点赞数 2

分类专栏：问答系统笔记文章标签：人工智能知识图谱

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Ljuice/article/details/108745740

版权

这篇论文提出了PullNet模型，通过迭代检索知识图谱和文本语料来解决开放域问答问题。PullNet能自主学习检索相关子图，并结合异构信息进行答案推理。实验结果显示，PullNet在多跳问题上表现出优越性能，特别是在不完整的知识库和文本语料情况下。

摘要由CSDN通过智能技术生成

在这里插入图片描述

题目： PullNet: Open Domain Question Answering with Iterative Retrieval on Knowledge Bases and Text

来源： EMNLP 2019

链接： https://arxiv.org/pdf/1904.09537.pdf

Introduction：

如今开放域问答的一个主流方法，利用维基百科和结构化知识图谱两者的结合来完成问答。目前比较好的思想是早期融合(early fusion)和后期融合(late fusion)的模型，并且已知前者是优于后者的。
然而，这些模型(主要指早期融合(early fusion)的GRAFT-net，这也是该作者的前一篇优秀工作，已有其它人对此工作进行解读-参考)在抽取子图时都是采用启发式规则的检索方法，该法并不显得智能化，会产生一些与答案无关或者答案无需利用到的子图。
而本文关注的重点就在于“学会自主检索”，即让模型自己懂得该(从 $K B$ 、文本语料)检索什么。文本称此为 $“ P u l l ”$ 操作。
自然地，另一个重点就在于“如何更好地组合这些异构信息”为单个数据结构来更好的推理出答案。

Contribution：

本文提出新的思想“Pull”，能够智能化扩充问题子图，即自主学习利用此操作抽取得问题相关的子图；
组合前一步得到的异构信息”，更新子图，最后利用GCN对节点进行表示学习，进而分类判断是否答案。

Model：

任务介绍：

给定问题 $q$ ，模型从知识图谱和文本语料两类知识源中检索得相关信息，构建出能用以回答的问题子图。

$G_n=\{\nu, \varepsilon \}$ ：问题 $q$ 的子图，也称为异构图，包含了与问题相关的文本语料和知识图谱的信息。 $\nu$ 为节点集合。

$\nu=\nu_e \cup \nu_d \cup \nu_f$ ：其中 $\nu_e$ 为实体节点集， $\nu_d$ 为文本节点集， $\nu_f$ 为事实节点集

单个实体节点： $v_e \in \nu_e$ ，源自 $K B$

单个文本节点： $v_d=\{w_1, ..., w_{|d|}\}$ ， $v_d \in \nu_d$ ，在本文中单个句子即为一个文本，源自Text Corpus

单个事实节点： $v_f = (v_s, r, v_0), v_f \in \nu_f, \{v_s,v_0\} \in \nu_e$

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。