arcface

1. 介绍

使用深度卷积神经网络(DCNNs)嵌入来表示人脸是人脸识别的首选方法。DCNNs将人脸图像映射到具有较小类内距离和较大类间距离的特征空间中。
训练用于人脸识别的DCNNs有两个主要的研究方向。训练一个多类别分类器,它可以在训练集中分离不同的身份,例如使用一个Softmax分类器,还有直接学习嵌入特征,例如 triplet loss。基于大规模训练数据集和复杂的DCNN结构,基于softmax loss的方法和triplet loss的方法都可以获得良好的人脸识别性能。然而,softmax loss损失和triplet loss都有一定的缺点。对于Softmax loss:(1)线性变换矩阵的大小随着身份数量n的增加而线性增大;(2)对于closed-set 分类问题,所学习的特征是可分离的,但对于open-set人脸识别问题,识别性不够。对于triplet loss:(1)人脸三元组的数量出现爆炸式增长,特别是对于大型数据集,导致迭代次数显著增加;(2)样本挖掘策略造成很难有效的进行模型的训练。
已经提出了几种变体来增强Softmax loss的识别能力。提出了centre loss,即每个特征向量与其类别中心之间的欧几里得距离,以获得类内紧度,而类间分散则由Softmax loss 的联合惩罚来保证。然而,在训练期间更新实际类别中心非常困难,因为可供训练的人脸类别数量最近急剧增加。
通过观察,发现通过Softmax loss 训练的分类DCNN最后一个完全连接层的权重与每个人脸类别的中心具有概念上的相似性,在中提出了一个乘法角度裕度惩罚,以同时加强类内紧度和类间差异,从而提高了训练模型的识别能力。尽管Sphereface引入了角度裕度的重要概念,但它的损失函数需要一系列近似才能计算出来,从而导致网络训练不稳定。为了稳定训练,他们提出了一个混合损失函数,其中包括标准的Softmax loss。经验上,softmax loss 在训练过程中占主导地位,因为基于整数的乘角裕度使得目标逻辑曲线非常陡峭,从而阻碍了收敛。CosFace直接将cosine裕度惩罚添加到目标逻辑回归中,与SphereFace相比,它获得了更好的性能,但更容易的实现,减少了softmax loss 联合监督的需要。

2. 提出的方法

2.1 ArcFace

传统的Softmax loss 在人脸识别中得到了广泛应用[22,5]。然而,Softmax loss 函数并没有明确地优化特征嵌入,以增强类内样本的相似度和类间样本多样性,这导致在较大的类内外观变化(例如姿势变化和年龄差异)和较大规模测试场景,深层人脸识别的性能存在差异。
我们从8个包含足够样本(大约1500个图像/类)的不同身份中选择人脸图像,分别训练具有Softmax loss和ArcFace loss 的二维特征嵌入网络。如图3所示,Softmax loss 提供了大致可分离的特征嵌入,但在决策边界中会产生明显的模糊性,而所提出的ArcFace loss 显然会在最近的类之间产生更明显的差距。
在这里插入图片描述

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值