《Natural language Inference Over Interaction Space》阅读笔记

最新推荐文章于 2022-10-10 20:43:21 发布

jshnaoko

最新推荐文章于 2022-10-10 20:43:21 发布

阅读量170

点赞数

分类专栏： NLP

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jshnaoko/article/details/111998105

版权

NLP 专栏收录该内容

10 篇文章 0 订阅

订阅专栏

1.主要贡献

提出了一种新型的网络结构（Interactive Inference Network, IIN），能够从交互空间（interaction space）中抽取句子对的语义特征；

基于注意力权重有助于理解文本的假设，提出一种词对词的注意力（交互张量），越密集的交互张量含有的语义信息越丰富；

2.模型结构

2.1 Interactive Inference Network

如下图左侧所示，IIN由5个部分组成，每个部分都可以以多种方式灵活实现。

（1）Embedding Layer

将每个词或短语表示成向量，构建句子的表示矩阵。这里可以使用预训练的词嵌入模型，如GloVe、word2vec等。还可以结合NER、句法分析等工具，给表示向量增加更多的词法、句法信息。

（2）Encoding Layer

以一种或多种特定方式对句子表示向量编码，比如使用循环神经网络来对序列建模、使用递归神经网络来对句子结构建模或使用注意力机制来对句子的长期依赖建模。

（3）Interaction Layer

计算每对表示向量间的余弦相似度或点乘，来对句子对交互信息建模。在此之上还可以通过两个表示矩阵之间的乘法来获得更高层的交互特征。

（4）Feature Extraction Layer

通过神经网络（CNN、RNN、TreeRNN）从交互特征中提取语义特征。

（5）Output Layer

对特征解码，给出预测。

2.2 Densely Interactive Inference Network

IIN的一种实例，简单但是在多个数据集上取得了SOTA效果。

（1）Embedding Layer

词嵌入 + 字符特征 + 句法特征

词嵌入：预训练的GloVe；

字符特征：通过1D卷积和时间维度上的max pooling得到；

句法特征：one-hot part-of-speech tagging feature + binary exact match feature

（2）Encoding Layer

双层highway network + self attention

（3）Interaction Layer

两个特征矩阵中的特征向量两两计算交互信息。

（4）Feature Extraction Layer

DenseNet / ResNet

（5）Output Layer

线性分类

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
《Natural language Inference Over Interaction Space》阅读笔记

1.主要贡献提出了一种新型的网络结构（Interactive Inference Network, IIN），能够从交互空间（interaction space）中抽取句子对的语义特征；基于注意力权重有助于理解文本的假设，提出一种词对词的注意力（交互张量），越密集的交互张量含有的语义信息越丰富；2.模型结构2.1 Interactive Inference Network如下图左侧所示，IIN由5个部分组成，每个部分都可以以多种方式灵活实现。（1）Embedding Lay.
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。