人脸识别系列文献阅读总结（1）

deel123

已于 2023-05-30 11:39:41 修改

阅读量472

点赞数 1

文章标签：人工智能计算机视觉深度学习算法

于 2023-05-30 11:33:44 首次发布

本文链接：https://blog.csdn.net/deel123/article/details/127460891

版权

人脸识别系列文献阅读总结（1）

总述
人脸识别的难点
人脸识别的研究点
参考

总述

最近阅读了一些人脸识别相关的文献，借此整理一下，方便后续的学习。
人脸识别从大类上来讲，属于图像检索的一个特殊的子领域。之所以特殊是因为人脸识别在当下的社会中应用非常广泛，比如手机上面的人脸识别、支付宝人脸识别功能、犯罪嫌疑人锁定等诸多领域内有许多应用，并且对算法的安全性要求比较高。如果误识别，很可能会造成财产损失等情况。因此，评价指标要比一般的图像检索的要求高，比如检索时，通常采用rank1的准确率。图像检索的一般步骤：
（1）人脸检测，从一张图片中找到人脸，并确定人脸ROI。
（2）对人脸ROI区域的人脸进行对齐对齐操作（人脸关键点检测——用来对齐人脸到规范化的坐标上）。
（3）特征提取。
（4）识别或验证（识别是从多张图片中识别出同属于query的图片，验证是指是否与query同属一个人）
人脸识别的一般流程

人脸识别的难点

（1）多尺度的问题，不同的人脸在图片中的比例有差异，客观上可能存在像素点少，人脸区域模糊的情况
（2）不同年龄段的识别问题。同一个人在不同的年龄阶段的外貌差异可能很大，如何客服年龄变化带来的障碍，也是一个难点。
（3）此外，还有表情变化、光照变化和遮挡带来的识别障碍。

人脸识别的研究点

人脸识别在上世纪90年代被提出后，FR就成为了一个比较热门的研究领域。在深度学习流行之前，也由许多研究。鉴于深度学习在人脸识别中的广泛应用，本文仅对利用深度学习进行人脸识别的内容进行整理。
人脸识别本质上属于分类，在分类任务中，softmax loss应用非常广泛，但在embedding space中则缺乏有效的特征分辨能力。因此，许多研究者通过多种方式改进损失函数，其中比较有名的有如下几个
（1）Triplet。三元组损失函数，在欧式距离上引入一个margin，以此增加特征的类间距离和减少类内距离。这个思想被其后的很多损失函数所采用。
（2）Center loss。在训练过程中对每个类别在minibatch尺度上统计出该类别feature的中心，希望所有feature离中心的距离都尽量小。
在这里插入图片描述

（3）Sphere loss。将权重向量归一化处理，使得特征向量的分布成为了基于特征向量模长的余弦函数损失，并在角度θ上添加了一个角约束。
A-softmax loss
（4）Cosface。将输出层的权重和特征向量均归一化处理，使得模型更加趋向于角度的方向上的学习。并进一步改进损失函数，计入余弦边际项margin。
在这里插入图片描述