RetinaFace: Single-stage Dense Face Localisation in the Wild

1.网络结构:

在这里插入图片描述
简单的来说就是backbone+FPN+SSH

Backbone

RetinaFace使用的是MobileNetV1-0.25 or Resnet50
Resnet50经过测试检测速度激活时mobile的2倍,所以我们在实验的过程中使用的时MobileNetV1-0.25,MobileNetV1-0.25就是在MobileNetV1的基础对每一层卷积核的通道数缩减到原来的四分之一。最后我们取骨干网络最后三层的特征C3、C4、C5作为FPN的输入,这三层feature map的大小并不是固定的,因为MobileNetV1的可以接受不同尺寸大小的图片,所以其输出不是固定的。

FPN

在这里插入图片描述
FPN在很多目标检测的网络中都有出现,最著名的就是YOLO系列。FPN是一种多吃多特征融合的方法,底层特征经过上采样之后和上层特征进行融合,就得到高分辨率、强语义的特征。特征C3、C4、C5经过FPN之后获得特征P3、P4、P5。

SSH(Single Stage Headless Face Detector)

在这里插入图片描述
作者用两个3*3卷积模拟5*5卷积,三个3*3卷积模拟7*7卷积,来扩大感受野,引入更多的上下文信息(人脸周边像素),同时SSH就有了三种不同感受野的卷积。P3、P4、P5在经过SSH之后变成了S3、S4、S5这三层既有丰富的语义特征,有用上下文信息,还能兼顾不同尺度的人脸。

2.检测头

最后一步就是将获得的S3、S4、S5传给检测头,作者把分类预测(由于人脸检测是一个二分类任务,分类预测的数值即人脸的置信度得分)、bbox微调(对先验框进行调整从而获得预测框,需要四个参数,前两个用于对先验框的中心进行调整,后两个用于对先验框的宽高进行调整)和人脸关键点预测(一共有五个人脸关键点,故共十个横纵坐标参数)这三部分拆开逐个进行推理。
最后在经过一次非极大值抑制就得到了最终的检测结果。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值