Multi-hop Reading Comprehension across Multiple Documents by Reasoning over Heterogeneous Graphs

Multi-hop Reading Comprehension across Multiple Documents by Reasoning over Heterogeneous Graphs 阅读笔记

动机:

解决multi-hop 的QA问题;

在single-hop的QA 任务中表现良好的co-attention 和self-attention 的结合,对于multi-hop 也很有用;

GNN(graph neural networks)被运用于解决multi-hop QA任务。

贡献:

作者提出了一个解决multi-hop QA的模型,叫做Heterogeneous Document-Entity (HDE) graph。

1. the HDE graph contains different types of query-aware nodes representing different granularity levels of information 【candidates (就是候选答案里面的选项), documents and entities】 .

2. HDE 有利于不同类型的节点间信息的交互

模型:

1.context encoding 

(1) 用GRU对query, document 和 候选答案进行编码,分别得到query向量表示H_q\in \mathbb{R}^{l_q\times h},第i个文本的向量表示H^s_i\in \mathbb{R}^{l^i_s\times h}和第j个候选答案的向量表示H^j_c\in \mathbb{R}^{l^j_s\times h}

(2) 抽取实体:

we propose to extract mentions of both query subject s and candidates C_q from documents.

抽取query 和 候选答案中的mention 作为实体,并利用simple exact match 策略定位mention的位置,再根据文本的向量表示,得到实体的向量表示M

(3) co-attention:  [套路]

  • 计算query 和第 i 个 document 之间的similarity matrix:

  • 计算query 和 第 i 个 document 的attention context :

  • 使用双向GRU编码co-attention document context:

  • 按列拼接,获得最终的co-attention context:

S_{ca}被期望为query-aware document context representation

类似地co-attention 被运用在 query - candicate C_{ca}; query-entities E_{ca}

(4) self-attentive pooling:

S_{ca}进行self-attention 操作,目的是

"self-attentive pooling is designed to convert the sequential contextual representation to a fixed dimensional non-sequential feature vector by selecting important query-aware information"

同理得到C_{sa}E_{sa}

 

2.Reasoning over HDE graph

(1) building graph:

用document, candicate , entities 作为节点,self-attentive 后的向量作为节点向量,并设计了一系列规则构建节点间的边。

(2) 信息传递:

经过效果对比,作者选用GCN的消息传递策略(message passing strategy),该过程由两步实现:聚合与组合。这两步反复迭代实现信息传递。

聚合:

其中,R是所有边类型的集合,N^r_i是边类型为r的节点i的邻居,h^k_j是k 层节点j 的向量表示。

组合:

在模型层数较大时,GNN往往会遇到过平滑问题(smoothing problem),导致图中节点表示过于相似、没有区分度。为解决这一问题,作者提出了一种门机制:

3.Score accumulation

经过图的构建与GNN迭代,我们现在得到了图的表示,基于该表示,我们现在可以对候选答案进行打分了。打分由候选答案和其相对应的实体两类节点参与:

H^C是候选答案节点的向量表示,H^E是候选答案所对应实体节点的表示。

  


 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值