Towards Universal Representation Learning for Deep Face Recognition(人脸识别)

Towards Universal Representation Learning for Deep Face Recognition
论文地址:https://arxiv.org/pdf/2002.11841.pdf

这篇论文出自美国NEC研究院。文章暂时没时间看,大致过了一遍。其中论文核心思想是:
1.传统的人脸识别需要目通过高质量的原始数据来“推导”低质量图像的识别
2.集成式模型通过集成多个模型的不同分布,来提升模型的识别率
3.本论文提出通过直接在原始数据进行处理,避免训练目标域与test域的不同导致精度损失。
在这里插入图片描述

Abstract

文章提出了目前的人脸识别存在的问题:
Recognizing wild faces is extremely hard as they appear with all kinds of variations. Traditional methods either train with specifically annotated variation data from target domains, or by introducing unlabeled target variation data to adapt from the training data。
通过将目标域与训练域尽可能接近。
为了去掉存在的问题,文章进一步提出了:propose a universal representation learning framework that can deal with larger variation unseen in the given training data without leveraging target domain knowledge。
其中所谓的framework 包含some semantically meaningful variations, such as low-resolution, occlusion and head pose
但是直接训练augmented data for training,则不会得到很好的训练结果 ,主要是这些augmented data 为hard examples。为了解决此问题:
再次提出

  1. split the feature embedding into multiple sub-embeddings, and associate different confidence values for each sub-embedding to smooth the training procedure。
  2. The sub-embeddings are further decorrelated by regularizing variation classification loss and variation adversarial loss on different partitions of them

Introduction

现在的人脸识别算法,通用做法:map input images to a feature space with small intra-identity distance and large inter-identity distance,
公开的数据集存在种族数目不均衡等large public datasets such as MS-Celeb-1M manifest strong biases, such as ethnicity。这些会导致数据在不同的数据集(目标域)导致accuracy大幅度下降。
为了减弱这些问题,学者进一步提出的方法:

  • by identifying relevant factors of variation and augmenting datasets to incorporate them through domain adaptation method;但这些 variations are hard to identify,所以被通常用于 align features between training and test domains。
  • individual models on various datasets and ensembled
    所有的上述处理方法均存在either only handle specific variations, or require access to test data distributions, or accrue additional runtime complexity to handle wider variations。并最终提出了propose learning a single“universal” deep feature representation that handles the variations in face recognition

Proposed Approach

在这里插入图片描述

  • Confidence-aware Identification Loss
    在这里插入图片描述
    其中fi
    将公式进行贝叶斯整理得到
    在这里插入图片描述
    再进行L2-norm之后:
    在这里插入图片描述
    如果只采用公式5,在样本中会产生:learned prototype will be in
    the center of all samples。
    在这里插入图片描述
    为了让不同 sample有不同的confience,且能够使得stronger push for
    low-quality fi to be closer to the prototype
    最后的Loss为
    在这里插入图片描述
    采用此LOSS相比COS loss的优点是:
    在这里插入图片描述

- Confidence-aware Sub-Embeddings
文章认为,Though the embedding filearned through a samplespecific gating si can deal with sample-level variations, we argue that the correlation among the entries of fiit self is still high即中间所有的特征也存在一定的相关性,为了减少这个相关性提出了:
Accordingly, the prototype vector wj and the confidence scalar si are also partitioned into the same size
K groups.
在这里插入图片描述
在这里插入图片描述
同是为了减少过拟合采用L2正则
在这里插入图片描述

  • . Sub-Embeddings Decorrelation
    如果采用上述的sub-embeddings,会出现 :does not guarantee the features in different groups are learning complementary information。如下图所示
    在这里插入图片描述
    采用的解决方式如下:
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

  • . ** Mining More Variations**
    to introduce more variations for better generalization ability, we aim to explore more variations with semantic meaning.
    在这里插入图片描述
    Uncertainty-Guided Probabilistic Aggregation
    为了解决Considering the metric for inference, simply taking the average of the learned sub-embeddings is sub-optimal.
    在这里插入图片描述
    Experiments
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

reference

  • https://arxiv.org/pdf/2002.11841.pdf
  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
近年来,半监督深度面部表情识别成为了人们关注的热点问题之一。在这个领域,研究人员一直致力于利用少量有标签的数据和大量无标签的数据来提高面部表情识别的准确性和鲁棒性。Adaptive是一种有效的半监督学习方法,它能够自适应地利用标签和无标签数据,使得深度学习模型在应用于面部表情识别时更加有效。 半监督学习是一种机器学习方法,利用少量有标签的数据和大量无标签的数据来训练模型。在面部表情识别中,往往很难获取大量有标签的数据,而无标签数据却很容易获取,因此半监督学习成为了一种有吸引力的解决方案。通过利用Adaptive方法,研究人员可以更好地利用无标签数据,提高模型的泛化能力和鲁棒性,从而提升面部表情识别的准确性。 Adaptive方法还可以帮助模型在数据分布变化时自适应地调整,使得模型更具灵活性和稳健性。在面部表情识别任务中,由于不同环境和条件下的面部表情具有差异性,Adaptive方法能够使模型更好地适应这种差异,提高识别的鲁棒性。 总之,半监督深度面部表情识别与Adaptive方法的结合,有望提高面部表情识别的准确性和鲁棒性,为人们提供更加高效和可靠的面部表情识别技术。相信随着更多研究和实践的开展,半监督深度面部表情识别将迎来更加广阔的发展前景。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值