论文阅读-文本匹配（一）孪生LSTM

最新推荐文章于 2024-02-25 09:14:02 发布

果7

最新推荐文章于 2024-02-25 09:14:02 发布

阅读量5.5k

点赞数

分类专栏： NLP（自然语言处理）文章标签： NLP deep-learning paper text text matching

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/coraline_m/article/details/78769931

版权

NLP（自然语言处理）专栏收录该内容

4 篇文章 0 订阅

订阅专栏

版权声明：本文为博主原创文章，未经博主允许不得转载。禁止抄袭。

由于作者资历尚浅，有理解错误的地方欢迎大家指正和交流。

论文简介

论文题目： Siamese Recurrent Architectures for Learning Sentence Similarity

论文地址：https://www.aaai.org/ocs/index.php/AAAI/AAAI16/paper/view/12195/12023

作者：Jonas Mueller，Aditya Thyagarajan

作者单位：Massachusetts Institute of Technology（MIT CSAIL）、M. S. Ramaiah Institute of Technology（印度 MSRIT）

出版单位：the Association for the Advance of Artificial Intelligence（AAAI）

发表时间：2016.2

模型图

贡献点：

1.提出新的度量方式（基于曼哈顿距离，见细节2）。优于欧几里得距离（梯度消失）、余弦相似度。【回归】

2.通过明确的指导（距离），使用简单LSTM能够建模复杂的语义。

3.使用MaLSTM features输入给SVM来进行分类。【分类】

实验数据：

1.The SICK data set （10k条）: http://clic.cimec.unitn.it/composes/sick.html

- sentence_A: sentence A
- sentence_B: sentence B
- entailment_label: textual entailment gold label (NEUTRAL, ENTAILMENT, or CONTRADICTION)
- relatedness_score: semantic relatedness gold score (on a 1-5 continuous scale)

1.1 回归问题，得分在1-5

1.2 分类问题，三类【entailment, contradiction, or neutral】

细节：

1.LSTM(a)和LSTM(b)权重设置一样(tied weights、主题一样)。在信息检索（IR）等其他应用场景可设置不一样(untied weights)。

2.度量方式使用基于曼哈顿距离d的dis=e^(-d),由于得分在1-5，因此做了dis*4.0+1.0的处理。简单的度量方式，让句子表示更好地表达复杂的语义关系。

3.LOSS函数使用MSE。训练使用BPTT。

4.词向量预训练（实验数据只有10k条），利用同义词扩充来数据增强。

5.input维度（300维）、hidden维度（50维）

关注

0
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。