整理的人脸系列学习经验:包括人脸检测、人脸关键点检测、人脸优选、人脸对齐、人脸特征提取等过程总结,有需要的可以参考,仅供学习,请勿盗用。https://blog.csdn.net/TheDayIn_CSDN/article/details/93199307
RetinaFace: Single-stage Dense Face Localisation in the Wild
论文地址: https://arxiv.org/pdf/1905.00641.pdf
github地址: https://github.com/deepinsight/insightface/tree/master/RetinaFace
思路:
整理人脸特征提取网络结构InsightFace: 2D and 3D Face Analysis Project时,发现这里出现一种RetinaFace的人脸检测器,在cpu/gpu上性能很强大,所以想尝试下载后端做人脸检测效果。后续给出模型训练以及实验效果。
一、论文简介
RetinaFace,它利用联合监督和自我监督的多任务学习,在各种人脸尺度上执行像素方面的人脸定位。
(1)在WIDER FACE数据集上手动注释五个面部标志,并在这个额外的监督信号的帮助下观察硬面检测的重要改进。
(2)进一步增加了一个自监督网格解码器分支,用于与现有的受控分支并行地预测像素三维形状的面部信息。
(3)在WIDER FACE硬测试装置上,RetinaFace的性能优于现有技术平均预测(AP)1.1%(达到AP等于91.4%)。
(4)在IJB-C测试集上,RetinaFace使最先进的方法(ArcFace)能够改善他们在面部验证中的结果(FAR = 1e-6的TAR = 89.59%)。
(5)通过采用轻量级骨干网络,RetinaFace可以在单个CPU内核上实时运行,以实现VGA分辨率的显示。
创新点
1、整合:人脸检测、人脸对齐、像素级的人脸分析、3D密集通信回归。
2、通过利用强监督和自监督多任务损失函数来实现上述功能。
3、基于单阶段设计,提出了一种名为RetinaFace的新型像素智能人脸定位方法,该方法采用多任务学习策略同时预测人脸分数,面部框,五个点和三维位置。
4、Mesh Decoder使用图卷积神经网络进行加速
Lcls:人脸分类loss
Lbox:人脸框回归loss
Lpts:人脸关键点回归loss,五点
Lpixel:自监督3D Mesh Renderer稠密人脸回归
特征金字塔网络结构:单阶稠密人脸定位,多任务loss学习。
Mesh Decoder实现:用图卷积替代普通卷积
实验结果
人脸检测是为了后续的识别算法,作者特意将检测结果送入人脸验证网络,在IJB-C test set上测试结果表明可以提高ArcFace的人脸验证精度(TAR=89.59% for FAR=1e-6)。
不同主干网络,在cpu和gpu上测试性能:
RetainFace在最大的人脸检测图片中可以检测到900个人脸,主要依靠联合额外监督信息和自监督多任务学习方法。