文献阅读 - FaceNet: A Unified Embedding for Face Recognition and Clustering

最新推荐文章于 2022-01-12 19:34:53 发布

K5niper

最新推荐文章于 2022-01-12 19:34:53 发布

阅读量788

点赞数 2

分类专栏：文献阅读

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhaoyin214/article/details/89851896

版权

FaceNet通过三元组损失函数训练深度卷积网络，将面部图像映射到欧氏空间，实现人脸识别和聚类。实验表明，这种方法在LFW和YouTube Faces DB上表现出色。

摘要由CSDN通过智能技术生成

FaceNet: A Unified Embedding for Face Recognition and Clustering

“Schroff F, Kalenichenko D, Philbin J. FaceNet: A unified embedding for face recognition and clustering[J]. 2015.”

摘要

FaceNet：直接学习面部图像到紧致欧氏空间（compact Euclidean space）的映射，其距离用于度量面部的相似度。

1 引言

FaceNet利用基于三元组（triplet-based）最大余量近邻（large margin nearest neighbor，LMNN）的损失函数训练网络，其输出表示为128维紧致向量。

在这里插入图片描述

距离为 $0$ 时，表示两张面部图像为同一个人；距离为 $4$ 时，表示两张面部图像不是同一个人。门限 $1.1$ 能够正确区分图中3组面部图像

2 相关工作

3 方法

本文给出一种将图像 $x$ 映射到特征空间（a feature space） ${\mathcal{R}}^d$ 的嵌入（embedding） $f (x)$ ，该嵌入能够减小同一用户所有面部图像之间平方距离（且与成像条件无关）；并增大任意不同用户面部图像之间的平方距离。

在这里插入图片描述

三元组损失（triplet loss）：在任意不同用户面部图像之间引入余量（enforce a margin）

3.1 三元组损失（Triplet Loss）

将图像 $x$ 映射到 $d$ 维欧氏空间（a $d$ -dimensional Euclidean space）中的嵌入（embedding）记为 $\in \mathcal{R}^{d}$ 。些外，将 $f (x)$ 限制在 $d$ 维超球面上，即 ${\|f(x)\|}_{2}=1$

在这里插入图片描述

锚点（anchor）： $x_{i}^{a}$ ，给定用户的面部图像
正样本（positive）： $x_{i}^{p}$ ，给定用户的其他面部图像
负样本（negative）： $x_{i}^{n}$ ，其他用户的面部图像

目标：使得给定用户的所有面部图像（锚点、正样本）间距小于该用户任意面部图像（锚点）与其他用户面部图像（负样本）间距。

$\left\| f(x_{i}^{a}) - f(x_{i}^{p}) \right\|^{2}_{2} + \alpha \lt \left\| f(x_{i}^{a}) - f(x_{i}^{n}) \right\|^{2}_{2} \tag{1}$

最低0.47元/天解锁文章

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。