答案选取(基于嵌入表示的相似度量)

最新推荐文章于 2024-06-04 14:47:20 发布

黄发良的博客

最新推荐文章于 2024-06-04 14:47:20 发布

阅读量960

点赞数

分类专栏： Answer Selection

本文链接：https://blog.csdn.net/falianghuang/article/details/74625514

版权

Answer Selection 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

1. ICLR2016- lstm-based deep learning models for nonfactoid answer selection

提出3个模型
QA-LSTM：利用参数共享的bi-lstm与（mean、max与concatenation之类）pooling操作获得问句与答句的分布式表示，然后进行问句与答句的相似匹配
这里写图片描述
QA-LSTM/CNN：在QA-LSTM中加入卷积层，对句子中连续m个单词进行卷积以发现局部连接模式：将句子分为若干个大小为m的窗口（ $H_m{(t)}=[H(t), H(t+1),\cdots,H(t+m-1)]$ ）,利用卷积核 $F=[F(0), F(1),\cdots, F(m-1)]$ 进行卷积操作 $o_F(t)=tanh[(\sum\limits_{i = 0}^{m - 1} {h{{(t + i)}^T}F(i)})+b]$ ,最后用k-maxpooling进行pooling
这里写图片描述
QA-LSTM with attention: 答句t时隐变量 $h_a(t)$ 与问句嵌入表示 $o_q$ , 则单词级注意模型为如下

${m_{a,q}}(t) = \tanh ({W_{am}}{h_a}(t) + {W_{qm}}{o_q})$
${s_{a,q}}(t) \propto \exp (W_{ms}^T{m_{a,q}}(t))$
${{\tilde h}_a}(t) = {h_a}(t){s_{a,q}}(t)$
本质是：在进行bi-lstm的每一步时都引入问句对该时间步的隐表示进行修正.

2.15-Applying deep learning to answer selection A study and an open task

提出6网络结构进行问答相似度的计算，其中Q与A分别为问句与答句，HL是对分布式表示的各个词 $x$ 进行非线性变换 $tanh(Wx+b)$ , CNN核函数的本质是 $N*M$ 矩阵，N为变换后的词嵌入空间维数，M类似k-gram中的k(用于捕捉序列数据的局部模式),P表示1-max pooling操作， T为非线性tanh操作。
构造hinge loss损失函数： $L=max \{0, m-cos(V_Q, V_{A+})+cos(V_Q,V_{A-})\}$
这里写图片描述

3. 16-IARNN(Inner Attention RNN)模型

文献：Inner Attention based Recurrent Neural Networks for Answer Selection

IARNN-WORD模型

对RNN网络的输入进行修正，即：利用问题部分的注意来答句中单词进行distill.

${\alpha _t} = \sigma \left( {r_q^T{M_{qi}}{x_t}} \right)$ : 借助 $M_{qi}$ 将问题注意 $r_q$ 投影到词嵌入空间中的一个点，并与答句中的当前单词 $x_t$ 做内积.
${\tilde x_t} = {\alpha _t} * {x_t}$ : 将标量 $\alpha _t$ 作为 $x_t$ 的权重来修正
其中
IARNN-WORD

IARNN-CONTEXT模型

动机：the answer sentence may consist of consecutive words that are related to the question, and a word may be irrelevant to question by itself but relevant in the context of answer sentence（单个词语与问句可能没有关系，但多个词语连在一起就可能与问句相关）
方法：引入场景信息来计算各词语的权重。权重计算方法修改如下：
${\alpha _t} = \sigma \left( {\left( {{M_{hc}}{{\rm{h}}_{t - 1}} + {M_{qc}}{r_q}} \right){x_t}} \right)$
IARNN-CONTEXT

IARNN-GATE模型

将GRU模型中的内部激励单元加入注意信息：
${z_t} = \sigma \left( {{W_{xz}}{x_t} + {W_{hz}}{h_{t - 1}} + {M_{qz}}{r_q}} \right)$
${f_t} = \sigma \left( {{W_{xf}}{x_t} + {W_{hf}}{h_{t - 1}} + {M_{qf}}{r_q}} \right)$
IARNN-GATE

黄发良的博客

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
答案选取(基于嵌入表示的相似度量)

1. ICLR2016- lstm-based deep learning models for nonfactoid answer selection提出3个模型 QA-LSTM：利用参数共享的bi-lstm与（mean、max与concatenation之类）pooling操作获得问句与答句的分布式表示，然后进行问句与答句的相似匹配 QA-LSTM/CNN：在QA-LSTM中加入卷积层，
复制链接

扫一扫