retinaface论文阅读

人脸检测训练过程通常同时包含分类和box回归损失,chen等人(即mtcnn网络),在观察到对齐后的人脸形状为人脸分类提供更好的特征的基础上,提出了将人脸检测和对齐结合在联合级联框架中,受[6]的启发,MTCNN和stn同时检测人脸和5个人脸landmark,由于训练数据的限制,mtcnn还没有验证微小的人脸检测是否可以从额外的5个人脸landmark的监督中获益.我们在本文中所要回答的问题之一是,能否利用5个人脸landmark构成额外监控信号,在wider face的hard测试集上推进目前最好的性能(90.3%[67])

在mask r-cnn中,通过添加一个用于预测目标的mask(这是啥?)的分支,与现有的用于边界框识别和回归的分支并行,显著提高了检测性能.这证实了密集的像素级注释也有助于改进检测,遗憾的是,对于wider face具有挑战性,无法进行密集的人脸注释(以更多的landmark或语义段的形式),由于有监督的信号不易获得,问题是我们能否应用无监督的方法进一步提高人脸检测.

在fan[56]中,提出了一种anchor-level注意图(attention map)来改进遮挡人脸检测,然而,所提出的注意图相当粗糙,不包括语义信息,近年来,自监督三维形态模型在wilder实现了很有前景的三维人脸建模,特别是mesh解码器,利用节点形状和纹理上的图形卷即实现了超实时速度.然而,应用mesh解码器到单级探测器的主要挑战是1)相机参数难以去准确地估计,2)联合潜在的形状和纹理表示是从单个特征向量(特征金字塔上的1*1conv)而不是roi池化的特征预测,这表示特征转换的风险.本文才用与现有监督分支并行的网格解码器通过自监督学习预测像素级的三维人脸形状.

综上所属,我们的主要贡献如下:

1. 在单阶段设计的基础上,提出了一种新的基于像素级的人脸定位方法retinaface,该方法采用多任务学习策略,同时预测人脸评分,人脸框,五个landmark以及每个人脸像素的三维位置和对应关系.<

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值