SimCSE: Simple Contrastive Learning of Sentence Embeddings

SimCSE

论文目的

SimCSE:simple contrastive sentence embedding framework
首先提出一种无监督的方法,仅使用dropout作为噪声,进行对比训练。与有监督的方法效果类似,dropout充当了最小的数据增强的方法,删除它模型会崩溃。
然后提出一种有监督的方法,使用自然语言推理(NLI)中的蕴含作为正对、矛盾作为负例,在STS任务上评估SimCSE,在无监督和有监督的任务上都有提升。
还在理论和试验上证明了对比学习目标将预训练嵌入的各向异性空间正则化,使其更加均匀。

相关工作

Contrastive Learning

L i = − log ⁡ exp ⁡ ( s i m ( h i , h i + / τ ) ) ∑ j = 1 N s i m ( h i , h j + / τ ) ) L_i=-\log\frac{\exp(sim(h_i,h^+_i/\tau))}{\sum_{j=1}^Nsim(h_i,h^+_j/\tau))} Li=logj=1Nsim(hi,hj+/τ))exp(sim(

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值