对比学习loss-Triplet Loss, Ranking Loss, Margin Loss、center loss

最新推荐文章于 2025-02-27 13:40:25 发布

zhurui_xiaozhuzaizai

最新推荐文章于 2025-02-27 13:40:25 发布

阅读量6.8k

点赞数 4

分类专栏：自然语言处理文章标签： tcp/ip 机器学习网络协议

本文链接：https://blog.csdn.net/weixin_36378508/article/details/121148244

版权

自然语言处理专栏收录该内容

92 篇文章

订阅专栏

Ranking Loss简介

ranking loss实际上是一种metric learning,他们学习的相对距离，而不在乎实际的值. 其应用十分广泛，包括是二分类，例如人脸识别，是一个人不是一个人。

在不同场景有不同的名字，包括 Contrastive Loss, Margin Loss, Hinge Loss or Triplet Loss. 但是他们的公式实际上非常一致的。大概有两类，一类是输入pair 对，另外一种是输入3塔结构。

Pairwise Ranking Loss

对于正样本。希望越接近越小。即LOSS = 距离
对于负样本，希望他们拉开m的差距。所以距离大于m的不考虑。

二分类Loss:

Triplet Ranking Loss

来自论文：
FaceNet: A Unified Embedding for Face Recognition and Clustering
论文阅读笔记

easy triplets(简单三元组): triplet对应的损失为0的三元组，形式化定义为d(a,n)>d(a,p)+margin，也就是负样本的距离远大于正样本的距离。

hard triplets（困难三元组）: negative example 与anchor距离小于anchor与positive example的距离，形式化定义为d(a,n)<d(a,p)，也就是负样本的距离远小于正样本的距离，意味着是易混淆的case。

semi-hard triplets（一般三元组）: negative example 与anchor距离大于anchor与positive example的距离，但还不至于使得loss为0，即d(a,p)<d(a,n)<d(a,p)+margin，依旧是介于能区分与容易区分之间，有差距但是差距不够大。

在这里插入图片描述

如何构造负样本

triple loss:

离线对比挖掘：

得到每一个样本的embedding.
计算（与负样本d(a,n)）和（与正阳本d(a,p)）与margin之间的距离差距。
判断属于easy triplets, hard triplets, semi-hard triplets,
选择其中hard or semi-hard triplets，因为easy太容易了，没有必要训练

在线对比挖掘

batch all: 同批次计算所有的valid triplet，对hard 和 semi-hard triplets上的loss进行平均。
不考虑easy triplets，因为easy triplets的损失为0，平均会把整体损失缩小
将会产生PK(K-1)(PK-K)个triplet，即PK个anchor，对于每个anchor有k-1个可能的positive example，PK-K个可能的negative examples
batch hard: 对于每一个anchor，选择hardest positive example(距离anchor最大的positive example)和hardest negative(距离anchor最小的negative example)，
由此产生PK个triplet
这些triplet是最难分的

计算所有的embedding 两两距离得到distances：（batch, batch）
计算所有三元组的情况：(batch, batch, batch)
得到一个3D的mask [a, p, n], 对应triplet（a, p, n）是valid的位置是True
得到当下标（i, j, k）不相等，且label[i]==label[j], label[i] != label[k]
计算所有的triple loss * mask , 再求平均
取 K 距离最大的 pos , K 距离最小的neg
pos_mask, neg_mask大小（batch, batch）
batch hard loss =
max(pos_mask* distances - neg_mask* distances + margin, 0)

一些别名

在不同场景有不同的名字

Ranking loss: 这个名字主要是在搜索场景用，希望模型能能够以一定顺序rank item。
Margin Loss: 这个则是希望用margin去代表距离。
Contrastive Loss:【pairloss】
N个样本。
y=1相似或者同标签，
d代表两个的欧式距离，
margin为给定的阈值

Triplet Loss: 通常是3塔结构