论文目的
SimCSE:simple contrastive sentence embedding framework
首先提出一种无监督的方法,仅使用dropout作为噪声,进行对比训练。与有监督的方法效果类似,dropout充当了最小的数据增强的方法,删除它模型会崩溃。
然后提出一种有监督的方法,使用自然语言推理(NLI)中的蕴含作为正对、矛盾作为负例,在STS任务上评估SimCSE,在无监督和有监督的任务上都有提升。
还在理论和试验上证明了对比学习目标将预训练嵌入的各向异性空间正则化,使其更加均匀。
相关工作
Contrastive Learning
L i = − log exp ( s i m ( h i , h i + / τ ) ) ∑ j = 1 N s i m ( h i , h j + / τ ) ) L_i=-\log\frac{\exp(sim(h_i,h^+_i/\tau))}{\sum_{j=1}^Nsim(h_i,h^+_j/\tau))} Li=−log∑j=1Nsim(hi,hj+/τ))exp(sim(