triplet loss 原理以及梯度推导

最新推荐文章于 2025-03-08 11:30:17 发布

置顶 tangwei2014

最新推荐文章于 2025-03-08 11:30:17 发布

阅读量7.5w

点赞数 38

分类专栏： DeepLearning 深度学习论文笔记文章标签： loss 损失函数梯度 layer triplet

本文链接：https://blog.csdn.net/tangwei2014/article/details/46788025

版权

DeepLearning 同时被 2 个专栏收录

11 篇文章

订阅专栏

深度学习论文笔记

8 篇文章

订阅专栏

【前言】
最近，learning to rank 的思想逐渐被应用到很多领域，比如google用来做人脸识别（faceNet），微软Jingdong Wang 用来做 person-reid 等等。learning to rank中其中重要的一个步骤就是找到一个好的similarity function，而triplet loss是用的非常广泛的一种。

【理解triplet】

这里写图片描述

如上图所示，triplet是一个三元组，这个三元组是这样构成的：从训练数据集中随机选一个样本，该样本称为Anchor，然后再随机选取一个和Anchor (记为x_a)属于同一类的样本和不同类的样本,这两个样本对应的称为Positive (记为x_p)和Negative (记为x_n)，由此构成一个（Anchor，Positive，Negative）三元组。

【理解triplet loss】
有了上面的triplet的概念， triplet loss就好理解了。针对三元组中的每个元素（样本），训练一个参数共享或者不共享的网络，得到三个元素的特征表达，分别记为：这里写图片描述。triplet loss的目的就是通过学习，让x_a和x_p特征表达之间的距离尽可能小，而x_a和x_n的特征表达之间的距离尽可能大，并且要让x_a与x_n之间的距离和x_a与x_p之间的距离之间有一个最小的间隔。公式化的表示就是：
这里写图片描述