两种对比学习损失：contrastive loss 和 infoNCE loss

最新推荐文章于 2025-04-01 11:23:02 发布

小葵花闪闪发光

最新推荐文章于 2025-04-01 11:23:02 发布

阅读量5.5k

点赞数 13

分类专栏：学习文章标签：神经网络人工智能深度学习

本文链接：https://blog.csdn.net/weixin_47032489/article/details/135746296

版权

学习专栏收录该内容

16 篇文章

订阅专栏

对比损失（contrastive loss）和信息最大化非条件估计损失（infoNCE loss）是两种常用于对比学习的损失函数。

不同点：

对比损失是通过将同类样本靠近、异类样本远离的方式进行训练，而infoNCE损失则是通过最大化正样本的概率和最小化负样本的概率来进行训练。
对比损失通常使用欧氏距离或余弦距离作为相似性度量，而infoNCE损失则使用信息论中的互信息来度量样本之间的相关性。
在实践中，对比损失常用于Siamese网络等结构中，而infoNCE损失则常用于自编码器等结构中。

相同点：

目标都是通过对比样本的相似性来学习特征表示。
都属于无监督学习方法，不需要标签信息。
都通过最大化特征之间的相似性或最小化特征之间的差异性来进行训练。

总的来说，对比损失和infoNCE损失都是有效的对比学习方法，可以用于无监督学习任务。选择使用哪种损失函数取决于具体的任务和模型结构，以及对样本相似性度量的需求。

在这里插入图片描述

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

小葵花闪闪发光

关注关注

13
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

对比学习损失 InfoNCE

ucas_v博客

06-19

3840

它侧重于学习一个特征空间，其中相似的样本被拉近，而不相似的样本被推远。对比学习损失：对于每个样本，计算其与正样本和负样本之间的距离。对比学习损失的目标是最小化正样本之间的距离，同时最大化负样本之间的距离。然后在有标签的数据上训练分类层，这可以是一个单独的训练阶段，也可以与对比学习损失的训练同时进行。数据准备：首先，为每个样本生成一个对应的正样本（相似的样本）和负样本（不相似的样本）。例如，如果你的数据集是图像分类任务，那么正样本可以是相同类别的不同图像，负样本可以是不同类别的图像。

InfoNCE损失

超大青花鱼的博客

07-16

1965

InfoNCE损失基于噪声对比估计的思想，用于训练模型来区分正样本对和负样本对。

参与评论您还未登录，请先登录后发表或查看评论

Contrastive Loss (对比损失)

最新发布

Hali_Botebie的博客

04-01

1020

InfoNCE Loss 是 NCE Loss 的高阶泛化，通过引入多分类对比和温度系数，更适合现代自监督学习任务。两者均基于噪声对比思想，但 InfoNCE Loss 在灵活性和性能上更优。二分类（数据 vs 噪声）：适用于显式噪声分布的简化场景，计算效率高但灵活性低。多分类（正样本 vs 负样本）：更适合自监督学习，通过动态采样和softmax优化特征空间判别性。如需进一步探讨具体任务（如NLP或CV中的应用），可补充说明场景。

Contrastive Loss(对比损失)

yanqianglifei的专栏

06-08

1万+

Contrastive Loss 在传统的siamese network中一般使用Contrastive Loss作为损失函数，这种损失函数可以有效的处理孪生神经网络中的paired data的关系。 siamese network-孪生神经网络 contrastive loss的表达式如下： # tensorflow伪代码 ...

详解常用的对比学习损失

weixin_47129891的博客

07-11

7264

对比学习损失函数用于在无监督或半监督的情况下学习数据表示，使得相似的数据样本在表示空间中更加接近，而不相似的样本更远离。

【深度学习】对比学习的损失函数

Dong_ZH的博客

12-19

2万+

损失（Contrastive Learning Loss）是一种用于自监督学习的损失函数。它侧重于学习一个特征空间，其中相似的样本被拉近，而不相似的样本被推远。在二分类任务中，对比学习损失可以用来学习区分正负样本的特征表示。损失函数有多种，其中比较常用的一种是InfoNCE loss。InfoNCE Loss损失函数是基于的一个损失函数，是由NCE Loss损失函数演变而来。

对比损失（Contrastive Loss）

HYXwoaini的博客

10-10

4581

其中 W 是网络权重；Y是成对标签，如果X1，X2这对样本属于同一个类，Y=0，属于不同类则 Y=1。Dw 是 X1 与 X2 在潜变量空间的欧几里德距离。当Y=0，调整参数最小化X1与X2之间的距离。当Y=1，如果X1与X2之间距离大于m，则不做优化（省时省力）；如果 X1 与 X2 之间的距离小于 m, 则增大两者距离到m。 ...

SoftCLT: 时间序列的软对比学习《Soft Contrastive Learning for Time Series》(时间序列、时序分类任务、软...

cnzzs的博客

06-30

456

2024年6月25日，10:11，好几天没看论文了，一直在摸鱼写代码(虽然也没学会多少)，今天看一篇师兄推荐的。论文：Soft Contrastive Learning for Time Series或者是：Soft Contrastive Learning for Time SeriesGitHub：https:/...

对比表征学习（一）Contrastive Representation Learning

weixin_48435461的博客

05-27

1125

主要参考翁莉莲的，本文主要聚焦于对比损失函数对比表示学习（Contrastive Representation Learning）可以用来优化嵌入空间，使相似的数据靠近，不相似的数据拉远。同时在面对无监督数据集时，对比学习是一种极其有效的自监督学习方式。

PyTorch 深度学习实战（28）：对比学习（Contrastive Learning）与自监督表示学习

m0_60414444的博客

03-29

1648

本文实现了基于对比学习的自监督表征学习框架，通过 InfoNCE 损失在 CIFAR-10 数据集上学习到具有判别性的特征表示。实验表明，仅使用线性分类器即可达到 82% 以上的验证准确率，证明了对比学习的有效性。在下一篇文章中，我们将深入计算机视觉的核心任务之一——《目标检测与 YOLO 实战》，探讨如何利用深度学习实现高效的目标检测系统。

【AI知识点】对比学习（Contrastive Learning）

AI完全体

10-16

2504

对比学习（Contrastive Learning）是一种基于样本之间相似性和差异性的无监督或自监督学习方法，旨在通过构建正例和负例对来学习数据的有效表示。对比学习广泛应用于自然语言处理（NLP）、计算机视觉（CV）等领域，尤其在表征学习（Representation Learning）中表现出色。通过对比正例和负例，模型能够学习到不同样本之间的相似性和差异性，从而生成更具区分性的特征表示。

对比学习 | 对比学习损失（InfoNCE loss）与交叉熵损失的联系温度系数的作用

"You are worthy! You can do it!"

03-03

2万+

Info NCE loss是NCE的一个简单变体，它认为如果你只把问题看作是一个二分类，只有数据样本和噪声样本的话，可能对模型学习不友好，因为很多噪声样本可能本就不是一个类，因此还是把它看成一个多分类问题比较合理（但这里的多分类 k 指代的是负采样之后负样本的数量，下面会解释）。唯一的区别是，在cross entropy loss里，k指代的是数据集里类别的数量，而在对比学习InfoNCE loss里，这个k指的是负样本的数量。温度系数τ虽然只是一个超参数，但它的设置是非常讲究的，直接影响了模型的效果。

干货 | 带你理解对比学习损失函数的性质以及温度系数的作用

zenRRan的博客

10-05

1万+

作者| Feng整理 | 对白的算法屋编者寄语：很多小伙伴都了解对比学习，但要说温度系数的作用可能就不太清楚了。卷友们好，我是对白。对比学习中的温度系数是一个神秘的参数，大部分论文都默认...

对比学习损失—InfoNCE理论理解

qq_42208244的博客

08-18

1万+

对比学习损失函数

对比损失（Contrastive Loss）详解

超大青花鱼的博客

10-19

2011

对比损失的基本思想是，通过构建一对样本 ( (x_i, x_j) )，如果这对样本来自同一类（即正样本对），模型应该使得它们在特征空间中的距离更小；而对于不同类别的样本（即负样本对），模型则应该使得它们在特征空间中的距离尽量大。对比损失（Contrastive Loss）是一种常见的度量学习损失函数，它通过学习样本对之间的相似性和差异性，使得相似样本对在特征空间中的距离更小，而不相似样本对的距离更大。通过最小化这一部分的损失，模型学习到相似样本的特征表示应该接近。，这一部分的损失将为零。

对比学习损失介绍

VIEO

12-17

4093

参考：表征学习的Contrastive Loss小结 - 知乎表征学习就是为了学到一种data的变换使得更加容易地解决下游的任务。该领域有很长的研究历史，从经典的PCA和ICA开始，然而这些方法倾向于学到data中的low-level的variations，比如对于下游的object recognition任务就不太合适。最近，基于self-supervised的表征学习很火，比如下面这两个问答：如何评价Kaiming He的Momentum Contrast for Unsupervised?

对比学习损失函数（RINCE/ReLIC/ReLICv2）

weixin_45657478的博客

07-16

8526

本文介绍3种对比学习损失函数，包含RINCE/ReLIC/ReLICv2。

推荐系统笔记（十）：InfoNCE Loss 损失函数

qq_46006468的博客

07-30

3万+

InfoNCELoss是为了将N个样本分到K个类中，K

InfoNCE Loss

03-09

### InfoNCE Loss 的定义 InfoNCE (Information Noise Contrastive Estimation) 是一种用于对比学习的损失函数，在自监督学习领域广泛应用。该损失函数旨在最大化正样本对之间的互信息，同时最小化负样本间的相似度。具体来说，给定一个锚点样本 \( z_i \)，以及对应的正样本 \( z_j \) 和一组负样本 \( {z_k} \)，InfoNCE 损失可以表达为： \[ L_{\text{InfoNCE}} = -\log \frac{\exp(\operatorname{sim}(z_i, z_j)/\tau)}{\sum_{k=1}^{K}\exp(\operatorname{sim}(z_i, z_k)/\tau)} \] 其中 \( \operatorname{sim}(.,.) \) 表示余弦相似度或其他形式的距离度量，\( \tau \) 称作温度参数[^1]。 ### InfoNCE Loss 的用途 InfoNCE 损失主要用于提升模型区分正样本和负样本的能力。通过优化这一损失函数，编码器能够学到更加鲁棒且具有判别性的特征表示。这些高质量的表征可以直接应用于各种下游任务，如分类、检索等，而无需额外标注大量数据。此外，由于 InfoNCE 不依赖于特定的任务设定，因此适用于多种模态的数据处理场景，比如图像、文本甚至音频等领域。 ### InfoNCE Loss 的实现方法以下是 Python 中使用 PyTorch 实现 InfoNCE 损失的一个简单例子： ```python import torch from torch import nn import torch.nn.functional as F class InfoNCELoss(nn.Module): def __init__(self, temperature=0.5): super().__init__() self.temperature = temperature def forward(self, anchor_embeddings, positive_embeddings, negative_embeddings=None): """ :param anchor_embeddings: 锚点样本嵌入 Tensor of shape (batch_size, embedding_dim) :param positive_embeddings: 正样本嵌入 Tensor of shape (batch_size, embedding_dim) :param negative_embeddings: 负样本嵌入 Tensor of shape (num_negatives, batch_size, embedding_dim), optional """ # 计算相似度矩阵 sim_matrix = torch.exp(F.cosine_similarity(anchor_embeddings.unsqueeze(1), positive_embeddings.unsqueeze(0)) / self.temperature) if negative_embeddings is not None: neg_similarities = torch.sum(torch.exp( F.cosine_similarity(anchor_embeddings.unsqueeze(1).unsqueeze(2), negative_embeddings.permute(1, 0, 2)) .reshape(len(anchor_embeddings), -1) / self.temperature), dim=-1) sim_matrix += neg_similarities # 计算并返回平均 NLL 损失 nll_loss = -torch.log(sim_matrix.diag() / sim_matrix.sum(dim=-1)).mean() return nll_loss ```