人脸方向学习(十五):Face Detection-RetinaFace解读

整理的人脸系列学习经验:包括人脸检测、人脸关键点检测、人脸优选、人脸对齐、人脸特征提取等过程总结,有需要的可以参考,仅供学习,请勿盗用。https://blog.csdn.net/TheDayIn_CSDN/article/details/93199307

RetinaFace: Single-stage Dense Face Localisation in the Wild

论文地址: https://arxiv.org/pdf/1905.00641.pdf
github地址: https://github.com/deepinsight/insightface/tree/master/RetinaFace

思路:

整理人脸特征提取网络结构InsightFace: 2D and 3D Face Analysis Project时,发现这里出现一种RetinaFace的人脸检测器,在cpu/gpu上性能很强大,所以想尝试下载后端做人脸检测效果。后续给出模型训练以及实验效果。

一、论文简介

RetinaFace,它利用联合监督和自我监督的多任务学习,在各种人脸尺度上执行像素方面的人脸定位。

(1)在WIDER FACE数据集上手动注释五个面部标志,并在这个额外的监督信号的帮助下观察硬面检测的重要改进。

(2)进一步增加了一个自监督网格解码器分支,用于与现有的受控分支并行地预测像素三维形状的面部信息。

(3)在WIDER FACE硬测试装置上,RetinaFace的性能优于现有技术平均预测(AP)1.1%(达到AP等于91.4%)。

(4)在IJB-C测试集上,RetinaFace使最先进的方法(ArcFace)能够改善他们在面部验证中的结果(FAR = 1e-6的TAR = 89.59%)。

(5)通过采用轻量级骨干网络,RetinaFace可以在单个CPU内核上实时运行,以实现VGA分辨率的显示。

创新点

1、整合:人脸检测、人脸对齐、像素级的人脸分析、3D密集通信回归。

2、通过利用强监督和自监督多任务损失函数来实现上述功能。

3、基于单阶段设计,提出了一种名为RetinaFace的新型像素智能人脸定位方法,该方法采用多任务学习策略同时预测人脸分数,面部框,五个点和三维位置。

4、Mesh Decoder使用图卷积神经网络进行加速

Lcls:人脸分类loss

Lbox:人脸框回归loss

Lpts:人脸关键点回归loss,五点

Lpixel:自监督3D Mesh Renderer稠密人脸回归

特征金字塔网络结构:单阶稠密人脸定位,多任务loss学习。

Mesh Decoder实现:用图卷积替代普通卷积

实验结果

人脸检测是为了后续的识别算法,作者特意将检测结果送入人脸验证网络,在IJB-C test set上测试结果表明可以提高ArcFace的人脸验证精度(TAR=89.59% for FAR=1e-6)。

不同主干网络,在cpu和gpu上测试性能:

RetainFace在最大的人脸检测图片中可以检测到900个人脸,主要依靠联合额外监督信息和自监督多任务学习方法。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值