ESimCSE: Enhanced Sample Building Method for Contrastive Learning of Unsupervised Sentence Embedding

最新推荐文章于 2023-02-03 15:20:27 发布

VIP文章红酒暖心也暖胃

最新推荐文章于 2023-02-03 15:20:27 发布

阅读量1k

点赞数

分类专栏： nlp 文章标签：深度学习自然语言处理 transformer

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zpp13hao1/article/details/122298240

版权

论文目的

SimCSE 使用dropout作为数据增强的最小方法，因为transformer使用位置embedding，句子的长度信息会被编码到句子embedding中，所以unsup-SimCSE的正对包含相同的长度信息。所以unsup-SimCSE训练的正样本对估计是有偏的，会倾向于将有相同或类似长度的句子是相似的，通过统计观察，发现unsup-SimCSE的确有这个问题。为了缓解它，使用一个简单的重复操作来修改句子，然后将句子和修改后的句子输入transformer来得到正对，且从CV中引入momentum contrast在不增加计算量的情况下来扩大负样本的数量，提出的两个方法分别用于政府样本，称为 Enhanced Unsup-SimCSE (ESimCSE)。

相关工作

在sts数据集上验证unsup-SimCSE训练的模型是有偏的，两个句子的长度差被模型学到了，所以句子差小于等于3的会比其它的效果好很多。
在这里插入图片描述
为了将句子的长度进行改变，常见的方法是随机插入和随机删除，但是这两种方法都有可能改变句子的语义，所以我们采取单词重复的方法，细节见下图。
修改句子长度方法比较
对比学习中的负样本，理论上负样本越多，效果越好，但是unsupSimCSE-BERT_base中
batch_size=64时效果最好，因此我们希望找出如何能有效的扩展负样本数量。momentum contrast通过维护一个队列，重复利用之前计算好的embedding来作为负样本，同时在有新的batch进入时，删除最久的batch，并会使用momentum更新之前的向量。当使用momentum encoder时，会关闭dropout，减小训练和预测之间的gap。
在这里插入图片描述

Proposed ESimCSE: Enhanced unsup-SimCSE

Word Repetition

使用sub-word 重复举个例子
$x=[x_1,...,x_N]$

最低0.47元/天解锁文章

红酒暖心也暖胃

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
ESimCSE: Enhanced Sample Building Method for Contrastive Learning of Unsupervised Sentence Embedding

论文目的SimCSE 使用dropout作为数据增强的最小方法，因为transformer使用位置embedding，句子的长度信息会被编码到句子embedding中，所以unsup-SimCSE的正对包含相同的长度信息。所以unsup-SimCSE训练的正样本对估计是有偏的，会倾向于将有相同或类似长度的句子是相似的，通过统计观察，发现unsup-SimCSE的确有这个问题。为了缓解它，使用一个简单的重复操作来修改句子，然后将句子和修改后的句子输入transformer来得到正对，且从CV中引入momen
复制链接

扫一扫

专栏目录

红酒暖心也暖胃 CSDN认证博客专家 CSDN认证企业博客

码龄7年

48: 原创

32万+: 周排名

138万+: 总排名

10万+: 访问

: 等级

1417: 积分

21: 粉丝

19: 获赞

65: 评论

39: 收藏

私信

关注

热门文章

分类专栏

最新评论

idea远程连接hive
文科生的编程路: https://www.cnblogs.com/shayue/p/ben-despark-zhi-jie-ji-qun-shang-dehive.html#:~:text=%E6%9C%AC%E5%9C%B0IDEA%E4%B8%AD%E4%BD%BF%E7%94%A8Spark%E7%9B%B4%E8%BF%9E%E9%9B%86%E7%BE%A4%E4%B8%8A%E7%9A%84Hive%201%20%E8%83%8C%E6%99%AF%20%E6%88%91%E7%94%A8VMWare%E6%90%AD%E5%BB%BA%E4%BA%86%E4%B8%80%E4%B8%AAHadoop%E9%9B%86%E7%BE%A4%EF%BC%8CSpark%E4%B8%8EHive%E7%AD%89%E7%BB%84%E4%BB%B6%E9%83%BD%E5%B7%B2%E7%BB%8F%E5%AE%89%E8%A3%85%E5%AE%8C%E6%AF%95%E3%80%82%20%E7%8E%B0%E5%9C%A8%E6%88%91%E5%B8%8C%E6%9C%9B%E5%9C%A8%E6%88%91%E7%9A%84%E5%BC%80%E5%8F%91%E6%9C%BA%E4%B8%8A%E4%BD%BF%E7%94%A8IDEA%E8%BF%9E%E6%8E%A5%E5%88%B0%E9%9B%86%E7%BE%A4%E4%B8%8A%E7%9A%84Hive%E8%BF%9B%E8%A1%8C%E7%9B%B8%E5%85%B3%E6%93%8D%E4%BD%9C%E3%80%82%202%20%E8%BF%9B%E8%A1%8C%E9%85%8D%E7%BD%AE%E4%BF%AE%E6%94%B9%20%E4%BF%AE%E6%94%B9Hive%E4%B8%AD%E7%9A%84hive-site.xml,%E6%9C%AC%E5%9C%B0IDEA%E4%BD%BF%E7%94%A8%20%E7%A4%BA%E4%BE%8B%E4%BB%A3%E7%A0%81%E5%A6%82%E4%B8%8B%EF%BC%9A%20import%20ml.dmlc.xgboost4j.scala.spark.%20...%204%20pom.xml%20
Simple Contrastive Representation Adversarial Learning for NLP Tasks
weixin_45916750: 有源码吗，感谢
suitesparse1.3.0配win10+vs2015
qq_42466012: 方便自己，方便他人，非常赞！
Simple Contrastive Representation Adversarial Learning for NLP Tasks
红酒暖心也暖胃: 在有监督的训练中，使用对抗样本作为原始样本的正样本；而无监督的训练中，利用第一个dropout来生成正对，对抗样本也会被用来作为正对
Simple Contrastive Representation Adversarial Learning for NLP Tasks
Hei.L: 样本经过两次dropout之后形成正对，负对应该是同一batch内的其他样本构成的吧

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。