人脸识别“FaceNet: A Unified Embedding for Face Recognition and Clustering”

最新推荐文章于 2020-07-07 16:59:53 发布

cv_family_z

最新推荐文章于 2020-07-07 16:59:53 发布

阅读量3.6k

点赞数 1

分类专栏：人脸识别深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cv_family_z/article/details/50425670

版权

深度学习同时被 2 个专栏收录

105 篇文章 0 订阅

订阅专栏

26 篇文章 1 订阅

订阅专栏

作者认为用于训练的三元组很重要，使用经过筛选的三元组数据训练，在LFW上识别率达到了99.63%。使用深度卷积网学习图像的欧式嵌入。

方法描述：
使用了两个网络Zeiler&Fergus，Inception网络。这个系统的架构如下：
这里写图片描述

将三元组损失用于识别，认证和聚类任务。学习一个embedding 函数 $f(x)$ 将图像x映射到特征空间 $\mathbb R^d$ ，使得同一人脸间的平方距离最小。

1.三元组损失
同一人间的距离小，不同人间的距离大：
这里写图片描述
损失函数是为了最小化：

损失函数学习的结果如下：
这里写图片描述

这里的关键是选择hard的三元组，让模型快速收敛，原则是，给定 $x^a_i$ ，选择hard正样本，最大化 $||f(x^a_i)-f(x^p_i)||^2_2$ ，选择hard负样本，最小化 $||f(x^a_i)-f(x^n_i)||^2_2$ 。这有可能导致误标记或质量较差的图像主宰hard的正样本和负样本。

作者介绍了两个方法避免这种情况，
Generate triplets offline every n steps, using the most recent network checkpoint and computing the argmin and argmax on a subset of the data.
Generate triplets online. This can be done by selecting the hard positive/negative exemplars from within a mini-batch.

为了避免选择最难的负样本，选择满足如下条件的semi-hard负样本，这些负样本落在margin $\alpha$ 的内部：
这里写图片描述

深度卷积网
作者使用了两个网络，分别分析FLOPS和网络参数对结果的影响，两个网络一个大一个小，分别用在数据中心和移动手机上，第一个ZF的网络深度为22层，有140百万个参数，每幅图像需要16亿次浮点运算。第二个网络是GoogleNet的Inception模型，参数和浮点运算次数小很多。

FLOPS与准确率之间的关系：
这里写图片描述

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。