《Siamese Recurrent Architectures for Learning Sentence Similarity》论文总结

最新推荐文章于 2022-06-30 16:56:26 发布

Ezail_xdu

最新推荐文章于 2022-06-30 16:56:26 发布

阅读量2.2k

点赞数 2

分类专栏：论文阅读 nlp 文章标签： siamese nlp

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_38526306/article/details/88033929

版权

本文总结了《Siamese Recurrent Architectures for Learning Sentence Similarity》论文，探讨了如何利用Siamese Recurrent Networks进行文本相似度比较。通过共享权重的LSTM对句子进行编码，解决了传统词袋模型的局限性，尤其在处理变长句子时，能有效捕捉上下文信息。实验表明，Manhattan distance作为相似度度量效果最佳。此外，双向LSTM的引入进一步提升了模型的表现，尤其在处理未登录词问题上。

摘要由CSDN通过智能技术生成

今天开始整理一些之前看过的论文，一是复习巩固基础，二是可以回过头来想一想有没有新的理解。

论文链接：

Siamese Recurrent Architectures for Learning Sentence Similarity

Learning Text Similarity with Siamese Recurrent Networks

Siamese Recurrent，中文名叫孪生网络，用于比较两段文本之间的相似性，是一种非常常用的网络结构，很多之后的网络结构也在使用这种思想，比如ESIM等。另外这种思想在推荐系统中也有一些使用，比如在itemcf种学习两个item的相似度矩阵，就可以用这种网络。

背景

在深度学习还没火起来之前，大家比较两段文本的相似性，都习惯用词袋模型或者 TF-IDF 模型，但是这些模型有几个很明显的缺点，一是没有用到上下文的信息，而是词与词之间联系不紧密，词袋模型难以泛化。

这种问题直到 LSTM 的出现或者说普及，才被慢慢解决。LSTM 或者说 RNN 模型，由于其天然的结构特点(不了解的同学可以去查阅相关内容，这篇文章不讲 LSTM 原理)，可以去适应变成的句子，比如我们要比较两个不同长度的句子的相似性，通过 RNN

最低0.47元/天解锁文章

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
《Siamese Recurrent Architectures for Learning Sentence Similarity》论文总结

今天开始整理一些之前看过的论文，一是复习巩固基础，二是可以回过头来想一想有没有新的理解。论文链接：Siamese Recurrent Architectures for Learning Sentence SimilarityLearning Text Similarity with Siamese Recurrent NetworksSiamese Recurrent，中文名叫孪...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。