一、概述
论文来源:TACL 2017
论文链接:Enhanced LSTM for Natural Language Inference
一种专为自然语言推断而生的加强版 LSTM
优点:
•
精细的设计序列式的推断结构。
•
考虑局部推断和全局推断。
句子间的注意力机制(intra-sentence attention),来实现局部的推断,进一步实现全局的推断
二、 模型原理
作者提到,可以采用句法的LSTM树来处理,也可以用BiLSTM处理, 这里我只介绍BiLSMT的方法,LSTM树的内容有兴趣可以自己阅读论文。
如上图,模型主要分三部分:Input Encoding, Local Inference Modeling, Inference Composition
2.1 Input Encoding
首先, 输入是直接采用两个query的emb