FaceNet中Triplet的正负样本的选取

最新推荐文章于 2024-07-12 16:55:56 发布

kwist_jay

最新推荐文章于 2024-07-12 16:55:56 发布

阅读量628

点赞数

分类专栏：学习笔记文章标签：人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/kwist_jay/article/details/126144865

版权

学习笔记专栏收录该内容

5 篇文章 0 订阅

订阅专栏

Triplet三元组的基本训练思想是使得类内距离变小，类间距离变大,示意如下：

于是可以构造约束条件：

其中： $x_{i}^{a}$ 表示anchor样本点， $x_{i}^{p}$ 表示正样本， $x_{i}^{n}$ 表示负样本。于是构造损失函数：

但问题在于如果我们选取满足（1）约束条件的样本，那么必然会使得loss很小，模型收敛速度很慢，相反的，我们选取违反约束条件的样本时，便能大大提升模型的收敛速度。那么我们的目标就变成了：

$\large select\ x_{i}^{p}\ subject\ to\qquad argmax_{x_{i}^{p}}||f(x_{i}^{a})-f(x_{i}^{p})||_{2}^{2}\quad (hard\ positive)$

$\large select\ x_{i}^{n}\ subject\ to\qquad argmin_{x_{i}^{n}}||f(x_{i}^{a})-f(x_{i}^{n})||_{2}^{2}\quad (hard\ negative)$

意思就是找到与anchor之间类内距离最大的点(hard positive)以及类间距离最小的点(hard negative)从而构成三元组进行优化。

解决方案：

在整个训练集上寻找argmax和argmin是困难的。如果找不到，会使训练变得困难,难以收敛，例如错误的打标签和差劲的反映人脸。因此需要采取两种显而易见的方法避免这个问题：

　　1.离线更新三元组(每隔n步)。采用最近的网络模型的检测点并计算数据集的子集的argmin和argmax(局部最优)。

　　2.在线更新三元组。在mini-batch上选择不好的正(类内)/负(类间)训练模型。(一个mini-batch可以训练出一个子模型)

　　本文中采用上述第二种方法。本文中，采用以下方法：

　　　　1.使用大量 mini-batch，从而得到几千个不好的训练模型。

　　　　2.计算mini-batch上的argmin和argmax。

总结：以上所有过程博主概括为：为了快速收敛模型-->需要找到训练的不好的mini-batch上的差模型(负样本)-->从而找到不满足约束条件/使损失增大的三元组

在本文中，训练集的每个mini-batch包含:

1. 每个身份的40个人脸

2. 随机放一些负样本人脸

实际采用方法：

1.采用在线的方式 (作者说，在线+不在线方法结果不确定)

2.在mini-batch中挑选所有的anchor positive 图像对 (因为实际操作时，发现这样训练更稳定)

3.依然选择最为困难的anchor negative图像对 (可以提前发现不好的局部最小值)

特殊情况：

选择最为困难的负样本，在实际当中，容易导致在训练中很快地陷入局部最优，或者说整个学习崩溃f(x)=0 //我在CNN学习的时候也经常会遇到这个问题，不过我的是f(x)=1。为了避免这个问题，在选择negative的时候，使其满足式(3)：

$\large ||f(x^{a}_{i})-f(x^p_i))||^{2}_{2}<||f(x^{a}_{i})-f(x^n_i))||^{2}_{2}.$

左边：Positive pair的欧式距离右边：negative pair的欧式距离。把这一个约束叫作semi-hard (半序关系)。因为虽然这些negative pair的欧式距离远小于 Positive pair的欧式距离，但是 negative pair的欧式距离的平方接近于Positive pair的欧式距离的平方。

参考文章：

https://www.cnblogs.com/lijie-blog/p/10168073.html

FaceNet: A Unified Embedding for Face Recognition and Clustering

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
FaceNet中Triplet的正负样本的选取

Triplet三元组的样本选取过程
复制链接

扫一扫

专栏目录

kwist_jay CSDN认证博客专家 CSDN认证企业博客

码龄6年

15: 原创

20万+: 周排名

107万+: 总排名

2万+: 访问

: 等级

322: 积分

9: 粉丝

21: 获赞

12: 评论

97: 收藏

私信

关注

热门文章

分类专栏

学习笔记 5篇
渗透测试 1篇

最新评论

关于GBN 回退N协议的一些理解
我叫王小美: 艾玛，你可真是个鬼才（佩服ing）
关于GBN 回退N协议的一些理解
kwist_jay: 这里我确实写的有点混淆，容易让人分不清楚T1是那个。在计算GBN信道利用率时，T1则代表是一整个窗口的数据发送所需要的时间，这里我改记作S吧，自然地窗口越大，S越大了，而S=N*T1（T1=数据帧大小/传输速率）.
关于GBN 回退N协议的一些理解
dayqqq: 你好博主，我想问问，为什么传输的数据相同，窗口越大T1越大呢，T1不是等于传输的数据大小÷传输速率吗？传输的数据大小是等于窗口大小×单个帧大小吗，那为什么窗口越大，T1越大呢？
关于GBN 回退N协议的一些理解
m0_74134142: 这么复杂，考这种怎么做得出来
关于GBN 回退N协议的一些理解
zhy330: 感谢博主，也是感觉怎么都不明白。不过最后是CSMA/CD啦😝

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。