S3FD

2017年的文章了,作者对已有基于anchor的人脸检测算法在感受野不匹配、小脸特征少、anchor匹配不均、以及浅层预测出现大量FP等问题分别分析并提出改进。

在这里插入图片描述

S3FD模型结构如上图可见为SSD的改进版,分别针对现有的不足,作者分别作了以下改进。

1.在模型结构上的改进
这一块作者称为scale-equitable framework,在vgg16模型基础上新增卷积层,并在6层特征图上分别做预测。作者通过对anchor尺度、有效感受野和实际人脸大小分析,设置以上的anchor大小以及在哪些层做预测是比较合适的。

2.在anchor匹配方面的改进
已有anchor匹配策略是先对所有GT找最匹配的anchor,然后再对anchor找匹配IOU大于一定阈值的GT来对anchor贴标签。可是anchor尺度是离散的而人脸大小分布是连续的,就会出现不同大小人脸匹配到的anchor数不均衡,看下图。作者对现有anchor匹配策略做出一定改进:第一步,将阈值大于0.35的anchor设置为正样本,这能增强GT匹配到的anchor数。第二步,对于匹配到anchor较少的GT,降低阈值到0.1,然后依据IOU排序,将最匹配的N个anchor设为GT匹配到的,这能增强小人脸匹配的anchor数。

在这里插入图片描述

3.max out background label
在浅层,anchor较多,造成很多FP,为了减少FP,作者设计了对cls预测采用max out策略。max out指对同一个anchor做多次背景预测(3次),然后将最大的背景预测值作为最终背景预测,而人脸预测只预测一次。

在这里插入图片描述

4.实现细节
作者也做了OHEM,训练增强就是图像增强然后随机裁剪缩放到640,随机翻转。
作者对较浅层的特征图在预测前还做了L2归一化,这是为啥也没讲?

作者将SSD和RPN作为baseline,F代表主干结构,S代表anchor匹配改进,M表示max out。发现结构改善提升最大啊,后面的tricks都有一定提升。
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值