相似度_对抗学习：SimCSE: Simple Contrastive Learning of Sentence Embeddings

最新推荐文章于 2024-01-03 22:07:59 发布

YingJingh

最新推荐文章于 2024-01-03 22:07:59 发布

阅读量422

点赞数

分类专栏：相似度论文记录文章标签：学习深度学习人工智能

本文链接：https://blog.csdn.net/Hekena/article/details/127480378

版权

论文记录同时被 2 个专栏收录

147 篇文章 9 订阅

订阅专栏

相似度

27 篇文章 2 订阅

订阅专栏

SimCSE: Simple Contrastive Learning of Sentence Embeddings

这篇论文，我觉得有意思。在创造对抗学习的正负例时，正例直接使用它本身。将同一个句子传递给预先训练好的编码器两次：通过应用两次dropout，我们可以得到两个不同的嵌入作为 “正实例”。然后，我们把同一小批中的其他句子作为 “负实例”。
我们首先描述了一种无监督的方法，它采用输入句子并在对比性目标中预测自己，只用dropout 的size大小作为噪音。

以语义相关的正实例之间的一致性和整个表示空间的均匀性来衡量所学嵌入的质量

alignment and uniformity

在这里插入图片描述

无监督训练过程

在无监督学习中，采用对抗学习增强实例语义表征能力。
训练目标：两个相同的实例采用不同的dropout mask。

在这里插入图片描述

监督训练过程

训练目标是预测两个句子之间的关系：是连带的、中性的还是矛盾的——entailment, neutral or contradiction.
在语料中，有positive instance，negative instance，original instance。

在这里插入图片描述

所以，做对抗学习的目的，也是为了解决了词向量表征的各项异性问题。

实验

STS任务:semantic textual similarity 任务

在这里插入图片描述

YingJingh

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
相似度_对抗学习：SimCSE: Simple Contrastive Learning of Sentence Embeddings

这篇论文，我觉得有意思。在创造对抗学习的正负例时，正例直接使用它本身。将同一个句子传递给预先训练好的编码器两次：通过应用两次dropout，我们可以得到两个不同的嵌入作为。然后，我们把同一小批中的其他句子作为。我们首先描述了一种无监督的方法，它采用输入句子并在对比性目标中预测自己，只用dropout 的size大小作为噪音。
复制链接

扫一扫