DSFD: dual shot face detector

DSFD为CVPR2019的工作,作者提出一种双分支的人脸检测算法,网络结果如下
在这里插入图片描述
创新点如下:

1.一种新的特征增强模块(FEM)
在这里插入图片描述
该模块可看做FPN的升级版,在特征融合后使用空洞卷积捕捉多尺度表征增强感受野
在这里插入图片描述
对比实验发现涨点明显

2.双分支结构
DSFD为并行双预测分支组成,训练阶段两条分支都作预测,而测试阶段仅使用第二条分支(特征增强分支)。为什么使用双分支呢?作者提到可以将第一条预测分支看成是一种辅助监督,使得特征更符合人脸检测(个人理解:第一条分支可看成一种特征约束)。其中两条分支除了采用的anchor基础大小不一致以外(原特征分支anchor较小),其余均一致(包括预测方式,损失)。两条分支相关的参数如下所示
在这里插入图片描述

3.优化的anchor匹配
作者提到现有的anchor匹配存在一个问题,离散的anchor大小与连续的face大小不匹配。作者的解决策略为2/5概率采用anchor-based-sampling(ABS)(百度pyramid提出的数据增强手段)进行,作者相比于原ABS做了一点修改,在本文中作者随机从anchor尺度中选一个来缩放,而原ABS中先对某选定face做anchor匹配,匹配完后在更小的anchor尺度中随机挑一个尺度再缩放。个人解读:原ABS会产生更多的小face,而本文中ABS对选定face随机缩放(可能放大,可能缩小,这就达到了多尺度覆盖增强,不过也没有很好解决一开始提出的问题呀~)。对了,还有3/5概率采用SSD的数据增强手段,IOU超过0.4设置为正样本。

4.progressive anchor loss(PAL)
为什么叫PAL,我不是太理解,难道因为双分支结构?这儿没啥好说的,就是两个分支分别做预测,真的没啥好说的。

对比实验作者还是比较丰富的,可以发现FEM涨点最明显,本以为最大的亮点PAL(双分支结构)涨点倒不是很多,最后大batch size涨点很猛啊!!!
在这里插入图片描述
不同backbone的对比,backbone带来的变换不逊于各种tricks啊!!!炼丹玄学
在这里插入图片描述

  • 2
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值