TripletLoss、HardTripletLoss笔记

最新推荐文章于 2024-10-03 12:34:48 发布

原创

最新推荐文章于 2024-10-03 12:34:48 发布 · 2.2k 阅读

16 ·

CC 4.0 BY-SA版权

本文深入探讨了Triplet Loss及其变种Hard Triplet Loss的工作原理，详细解释了如何通过构造三元组样本（Anchor，Positive，Negative）来优化特征表示，使同类样本距离更近，异类样本距离更远。并通过代码示例展示了两种损失函数的实现过程。

一、TripletLoss
在这里插入图片描述
如上图所示，triplet是一个三元组，这个三元组是这样构成的：从训练数据集中随机选一个样本，该样本称为Anchor，然后再随机选取一个和Anchor (记为x_a)属于同一类的样本和不同类的样本,这两个样本对应的称为Positive (记为x_p)和Negative (记为x_n)，由此构成一个（Anchor，Positive，Negative）三元组。

有了上面的triplet的概念， triplet loss就好理解了。针对三元组中的每个元素（样本），训练一个参数共享或者不共享的网络，得到三个元素的特征表达，分别记为： $f(x_{i}^{a}),f(x_{i}^{p}), f(x_{i}^{n})$ 。triplet loss的目的就是通过学习，让x_a和x_p特征表达之间的距离尽可能小，而x_a和x_n的特征表达之间的距离尽可能大，并且满足以下公式： $∣∣f(xia)−f(xip)∣∣22+α<∣∣f(xia)−f(xin)∣∣22||f(x_{i}^{a})-f(x_{i}^{p})||_{2}^{2}+\alpha<||f(x_{i}^{a})-f(x_{i}^{n})||_{2}^{2}$
对应的目标函数也就很清楚了：
$∑iN[∣∣f(xia)−f(xip)∣∣22−∣∣f(xia)−f(xin)∣∣22+α]+\sum_{i}^{N}[||f(x_{i}^{a})-f(x_{i}^{p})||_{2}^{2}-||f(x_{i}^{a})-f(x_{i}^{n})||_{2}^{2}+\alpha]_{+}$