S3FD

最新推荐文章于 2022-07-04 09:56:43 发布

Shane Zhao

最新推荐文章于 2022-07-04 09:56:43 发布

阅读量490

点赞数

分类专栏：目标检测文章标签：人脸检测

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/silence2015/article/details/105716595

版权

目标检测专栏收录该内容

9 篇文章 4 订阅

订阅专栏

2017年的文章了，作者对已有基于anchor的人脸检测算法在感受野不匹配、小脸特征少、anchor匹配不均、以及浅层预测出现大量FP等问题分别分析并提出改进。

在这里插入图片描述

S3FD模型结构如上图可见为SSD的改进版，分别针对现有的不足，作者分别作了以下改进。

1.在模型结构上的改进
这一块作者称为scale-equitable framework，在vgg16模型基础上新增卷积层，并在6层特征图上分别做预测。作者通过对anchor尺度、有效感受野和实际人脸大小分析，设置以上的anchor大小以及在哪些层做预测是比较合适的。

2.在anchor匹配方面的改进
已有anchor匹配策略是先对所有GT找最匹配的anchor，然后再对anchor找匹配IOU大于一定阈值的GT来对anchor贴标签。可是anchor尺度是离散的而人脸大小分布是连续的，就会出现不同大小人脸匹配到的anchor数不均衡，看下图。作者对现有anchor匹配策略做出一定改进：第一步，将阈值大于0.35的anchor设置为正样本，这能增强GT匹配到的anchor数。第二步，对于匹配到anchor较少的GT，降低阈值到0.1，然后依据IOU排序，将最匹配的N个anchor设为GT匹配到的，这能增强小人脸匹配的anchor数。

在这里插入图片描述

3.max out background label
在浅层，anchor较多，造成很多FP，为了减少FP，作者设计了对cls预测采用max out策略。max out指对同一个anchor做多次背景预测（3次），然后将最大的背景预测值作为最终背景预测，而人脸预测只预测一次。

在这里插入图片描述

4.实现细节
作者也做了OHEM，训练增强就是图像增强然后随机裁剪缩放到640，随机翻转。
作者对较浅层的特征图在预测前还做了L2归一化，这是为啥也没讲？

作者将SSD和RPN作为baseline，F代表主干结构，S代表anchor匹配改进，M表示max out。发现结构改善提升最大啊，后面的tricks都有一定提升。
在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。