【论文阅读笔记】《S3FD:Single Shot Scale-invariant Face Detector》

《S3FD:Single Shot Scale-invariant Face Detector》

Zhang S, Zhu X, Lei Z, et al. S3fd: Single shot scale-invariant face detector[C]//Proceedings of the IEEE International Conference on Computer Vison

This paper is Inspired by faster-RCnn and SSD.

网络结构如下:

创新点:

1.scale-equitable architecture

扩大anchor-associated layer 的范围

将prediction convolutional layers 的stride size 的范围扩大到4-128,将anchors的scale范围扩大到16-512 pixels。

网络的关键参数的设置情况如下所示:

anchor的scale的设置遵守以下两条准则:

①:Effective receptive field

将anchor 的大小设置为卷积核有效感受野的大小。

②:Equal-proportion interval principle:

将anchor 的scale设置为4*stride,保证不同scale的anchor在input image 中的分布密度相同,保证与不同尺度的face的金标准bounding box 所match的anchor的数量大体相同。

 

2.Scale compensation anchor matching strategy

    anchor的scale是离散的,但是face的尺度却是连续的,这会导致处于相邻两个anchor's scale 之间的face不能匹配到足够多的anchor,并且比较小的face也不能匹配到足够多的anchor,如图4(a)蓝色虚线所示,这导致处于这些scale的face不能被有效的学习及预测。

并且平均匹配到的anchor的个数为3,太少了。

与金标准bounding box 所匹配的anchor的个数与anchor的scale关系非常大。

为了解决这个问题,提出了尺度补偿 anchor 匹配策略,对匹配的anchor进行补偿,补偿方式如下所示:

补偿后,匹配数量与face的尺度的大小的关系如图4(a)红线所示。

 

3.Max-out back ground label

由于负样本的数量太多(99.8%),并且绝大部分来自于层次比较低的feature layer(75.02%),这些负样本会导致比较小scale 的face 的false positive 的概率比较大,所以为了降低false positive 的概率,在conv3_3层后使用多个conv filter 输出多个背景概率,并对这多个背景预测filter后添加一个maxout层,

 

我理解为,背景信息十分负杂,使用一个conv_filter 不足以捕捉背景的信息,使用多个filter对背景信息进行捕捉,即将背景分为多个类进行学习,使用最高的概率作为输出,即此patch 属于哪个背景的概率最大,无论属于哪一类背景,均是背景,只有一个标签,因此将其经过maxout层后再输出,对maxout 的输出对应的filter进行训练,可有效捕捉不同类别的背景的信息,这可使网络对背景的识别率提高。由于75.02%的负样本来自于conv3_3,因此只对这层采取这个策略即可有效提升。

训练细节:

1.数据增强

2.loss 函数

Loss 函数的设置与ssd相同。

3.hard negative mining

   Sort negative samples by the loss value, and pick the top ones so that the ratio between the negatives and positives is at 3:1。

其中 maxout的filter的数量  𝑁𝑚=3 ,loss函数中的权重 𝜆=4。

实验结果表明:相对于SSD和RPN,S3FD对于人脸探测的性能有所提升,并且对探测较小的face的性能有较大的提升:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值