学习一下对比学习

最新推荐文章于 2025-03-03 21:07:01 发布

choose_c

最新推荐文章于 2025-03-03 21:07:01 发布

阅读量1.9k

点赞数 1

分类专栏：深度学习文章标签：深度学习

本文链接：https://blog.csdn.net/choose_c/article/details/118887848

版权

深度学习专栏收录该内容

33 篇文章

订阅专栏

由于在做一些语义相似的工作，其中看了陈丹奇组的SimCSE使用了对比学习刷新了有监督和无监督的SOTA，自己也在做一些相关的下游任务的实验，其中就使用了图像和nlp领域都非常火的对比学习的方法，看了一下张俊林大神知乎对于对比学习的研究进展精要，讲的还是一如既往的清晰易懂。还是做一下搬运工，做一下自己的提炼记录。

对比学习分类

对比学习是无监督学习中自监督学习中的一种，其中NLP中的预训练模型MLM就是自监督学习(使用辅助任务挖掘无监督语料自身的监督信息)。图像中的自监督分为两种：生成式(VAE,GAN),判别式(对比学习)。而对比学习又可以分为1.基于负例；2.基于对比聚类；3.基于不对称网络；4.基于冗余消除损失函数等。对比学习中的要点是构造正反例，构造学习模型，防止模型坍塌。其中的几种模型方法都是在这三个要点上进行变换和改进。

基于负例的对比学习

代表模型：Moco，SimCLR

SimCLR

使用常见的图像增强方法构造正例，负例来自于batch内部。模型结构使用双塔结构，如下图所示，在encoder层后又加入了project层。

1.为什么在encoder后面要加入project层？

Moco中没有使用project，但是实验证明了project的有效性；但是张俊林提出了自己的猜测：encoder之后的特征表示包含了更多的包含图像增强信息在哪的细节特征，project可以进行过滤；预训练时特征会有两种：通用特征和任务相关特征；加入project后区分了两者特征，encoder之后的特征更加通用化(供后面的finetune使用)，project后的特征与预训练的任务相关；

2.相似计算要做L2正则？

L2把特征向量映射到了单位超球面，单位向量长度可以增加了训练的稳定性，超球面可以区分类别，提高模型表示能力。归一化后的向量的点积与余弦距离是等价的，所以相似性计算可以使用L2之后的点积或者是cosine。

3.对比学习的表示能力的评判标准

特征学习表示能力的评判标准uniform和alignment出自该论文。 alignment：正例的距离相近，特征表示最直接表现。
uniform：特征均匀分布在球面上，防止模型坍塌。(分布均匀表示两两有差异，信息保留更多。)

4.损失函数

分子是alignment，分母就是uniform。
温度系数t就是uniform和容忍性的权衡，越小表示越关注距离近的负例，但是太小的话，有可能产生误判，越大就是对误判为反例有更大的容忍性。温度系数更详细的分析可以看这篇知乎。