ESimCSE 论文笔记

ESimCSE通过改进正负样本构建方法提升了无监督句子嵌入的对比学习效果。它使用单词重复作为正样本生成策略,引入动量对比学习增加负样本数量,避免了批大小增加带来的性能下降。实验证明,这些改动在BERT-base上提高了Spearman相关度2.02%。
摘要由CSDN通过智能技术生成
单位:中国科学院信息工程研究所,中国科学院大学,快手科技
时间:2022.09
发表:COLING
论文链接: https://arxiv.org/abs/2109.04380

一、前言

1. ESimCSE想做些什么?

SimCSE 采用两次 dropout 作为一对正样本来当作数据增强的方法(详细内容可见我的上一篇笔记),但这样有一个不好的地方就是模型会偏向认为具有相同长度的句子彼此之间就更为相似。

为了验证这一观点,作者根据句子对的长度差异是否≤3,将每个STS测试集划分为两组,计算每组的模型预测和正则化标准答案之间的相似度差异。结果如表所示,当长度差≤3时,七个数据集的平均相似性差异较大,这验证了作者的假设。

让我比较奇怪的是下面的 ESimCSE ,虽然两者的差距是缩小了,但相似性差异都比 SimCSE 差异大是怎么回事。

2. ESimCSE做到了什么?

为了缓解上述的问题,作者应用一个简单而有效的重复操作来修改输入句子,然后将输入的句子及其修改后的对应句子分别传递给预先训练好的 Transformer 编码器,彼此间作为正样本。此外,还从计算机视觉领域获得灵感,引入了动量对比来增加负数对的数量,而不需要进行

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值