相似度:多边视角:2017:Bilateral Multi-Perspective Matching for Natural Language Sentences

Bilateral Multi-Perspective Matching for Natural Language Sentences

以前的方法要么是从单一方向匹配句子,要么只应用单一的粒度(逐字或逐句)匹配。在这项工作中,我们提出了一个双边多视角匹配(BiMPM)模型。给定两个句子P和Q,我们的模型首先用BiLSTM编码器对它们进行编码。接下来,我们在两个方向上对这两个编码的句子进行匹配,即P对Q,Q对P。在每个匹配方向上,一个句子的每个时间步骤与另一个句子的所有时间步骤从多个角度进行匹配。然后,利用另一个BiLSTM层将匹配结果汇总成一个固定长度的匹配向量。

Introduction

这部分有彩蛋:提到了使用两个独立额encoder编码两个句子的情况下,会导致两个句子之间的交互弱的现象。

这篇文章提出的问题是:首先,一些方法只探索了逐字匹配[Rocktaschel ¨ et al., 2015],但忽略了其他粒度的匹配(例如,逐句匹配);其次,匹配只在单一方向进行(例如,P与Q的匹配)[Wang and Jiang, 2015],但忽略了反方向(例如,Q与P的匹配)

模型结构

在这里插入图片描述

  • Word represention layer:Word ebedding和character embedding context
  • representation layer:两个bilstm得到上下文表示
  • match layer:match each time-step of P against all time-steps of Q,and match each time-step of Q against all time-steps of P.
  • Aggregation layer:合并表示:通过连接BiLSTM模型的最后一个时间步的(四个绿色)向量来构建固定长度的匹配向量
  • prediction layer:一个两层前馈神经网络,消耗固定长度的匹配向量,并在输出层应用sof tmax函数

在匹配层中,提出了四种策略
**(1) 完全匹配。**图2(a)是这种匹配策略的示意图。在这个策略中,每个前向(或后向)语境嵌入-→h p i(或←- h p i)与另一个句子的前向(或后向)表示的最后时间步骤-→h q N(或←- h q 1)进行比较。
(2) Maxpooling-Matching。图2(b)给出了这种匹配策略的图示。在这个策略中,每个前向(或后向)语境嵌入-→h p i(或←- h p i)与另一个句子的每个前向(或后向)语境嵌入-→h q j(或←- h q j)进行比较,对于j∈(1…N),只保留每个维度的最大值。
(3) 专注-匹配。图2(c)显示了这种匹配策略的图示。我们首先计算每个前向(或后向)语境嵌入-→h p i(或←- h p i)与其他句子的每个前向(或后向)语境嵌入-→h q j(或←- h q j)之间的余弦相似度。

(4) 最大注意力匹配。图2(d)是这种匹配策略的图示。这个策略与关注度匹配策略类似。然而,我们不是将所有上下文嵌入的加权和作为关注向量,而是选择具有最高余弦相似度的上下文嵌入作为关注向量。然后,我们将句子P的每个上下文嵌入与它的新关注向量相匹配。

在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

YingJingh

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值