人脸识别系列文献阅读总结(1)

人脸识别系列文献阅读总结(1)

总述

最近阅读了一些人脸识别相关的文献,借此整理一下,方便后续的学习。
人脸识别从大类上来讲,属于图像检索的一个特殊的子领域。之所以特殊是因为人脸识别在当下的社会中应用非常广泛,比如手机上面的人脸识别、支付宝人脸识别功能、犯罪嫌疑人锁定等诸多领域内有许多应用,并且对算法的安全性要求比较高。如果误识别,很可能会造成财产损失等情况。因此,评价指标要比一般的图像检索的要求高,比如检索时,通常采用rank1的准确率。图像检索的一般步骤:
(1)人脸检测,从一张图片中找到人脸,并确定人脸ROI。
(2)对人脸ROI区域的人脸进行对齐对齐操作(人脸关键点检测——用来对齐人脸到规范化的坐标上)。
(3)特征提取。
(4)识别或验证(识别是从多张图片中识别出同属于query的图片,验证是指是否与query同属一个人)
人脸识别的一般流程

人脸识别的难点

(1)多尺度的问题,不同的人脸在图片中的比例有差异,客观上可能存在像素点少,人脸区域模糊的情况
(2)不同年龄段的识别问题。同一个人在不同的年龄阶段的外貌差异可能很大,如何客服年龄变化带来的障碍,也是一个难点。
(3)此外,还有表情变化、光照变化和遮挡带来的识别障碍。

人脸识别的研究点

人脸识别在上世纪90年代被提出后,FR就成为了一个比较热门的研究领域。在深度学习流行之前,也由许多研究。鉴于深度学习在人脸识别中的广泛应用,本文仅对利用深度学习进行人脸识别的内容进行整理。
人脸识别本质上属于分类,在分类任务中,softmax loss应用非常广泛,但在embedding space中则缺乏有效的特征分辨能力。因此,许多研究者通过多种方式改进损失函数,其中比较有名的有如下几个
(1)Triplet。三元组损失函数,在欧式距离上引入一个margin,以此增加特征的类间距离和减少类内距离。这个思想被其后的很多损失函数所采用。
(2)Center loss。在训练过程中对每个类别在minibatch尺度上统计出该类别feature的中心,希望所有feature离中心的距离都尽量小。
在这里插入图片描述

(3)Sphere loss。将权重向量归一化处理,使得特征向量的分布成为了基于特征向量模长的余弦函数损失,并在角度θ上添加了一个角约束。
A-softmax loss
(4)Cosface。将输出层的权重和特征向量均归一化处理,使得模型更加趋向于角度的方向上的学习。并进一步改进损失函数,计入余弦边际项margin。
在这里插入图片描述

(5)Arcface。进一步对比分析了在训练过程中角度θ的变化范围,在cosface上改进了损失函数,将边际项由余弦函数外面改到内部,即余弦函数内的角度边际项。论文分析说,又增加损失函数的惩罚力度。
在这里插入图片描述

不过,到底多大的惩罚力度才算合适?上述损失函数中,引入边际项,导致训练时特征向量被挤压到更小的空间分布中。因此,从理论上将,特征向量并不能被无限被挤压,是有一个限度的。如何确定这个限度?值得深入思考和分析。

未完待续……

参考

1、Deep Face Recognition: A Survey
2、A Discriminative Feature Learning Approach for Deep Face Recognition
3、SphereFace: Deep Hypersphere Embedding for Face Recognition
4、CosFace: Large Margin Cosine Loss for Deep Face Recognition
5、ArcFace: Additive Angular Margin Loss for Deep Face Recognition

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值