SCRFD: Sample and Computation Redistribution for Efficient Face Detection

最新推荐文章于 2024-06-04 09:49:54 发布

qq_37380036

最新推荐文章于 2024-06-04 09:49:54 发布

阅读量432

点赞数

分类专栏：深度学习文章标签：深度学习计算机视觉

本文链接：https://blog.csdn.net/qq_37380036/article/details/127635603

版权

深度学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

在这里插入图片描述

论文地址：https://arxiv.org/pdf/2105.04714.pdf
代码地址：https://github.com/deepinsight/insightface/tree/master/detection/scrfd

一、概述

创新点：

样本重分布(SR)：基于基准数据集的统计数据，在最需要的步骤上分配更多训练样本。
计算重分布(CR): 基于精心定义的搜索方法，在模型的主干，颈部和头部之间重新分配计算，灵感来源于RegNet(关于网络设计范式)。

贡献：

探讨了VGA分辨率下人脸检测的效率，并提出了样本重分配的策略，其有助于浅层步骤获取更多的训练样本。
设计了一个简化的搜索空间，用于在人脸检测器的不同组件之间重新分配计算。
在困难样本集上的准确率比TinaFace 高出3.86%, 同时速度提升3倍。

二、方法

2.1 Sample Reallocation

样本重分布方法（SR）相当于为模型增加先验，基于基准数据集的统计数据——人脸尺寸占比，在最需要的步骤上分配更多的训练样本，即在微小人脸分支上增加更多的训练图片，提升训练的准确率。
在这里插入图片描述

上图左侧为WIDER FACE 数据集的人脸尺寸占比，可以看出WIDER FACE 数据集中有78.93%的人脸尺寸小于32 * 32，而提升人脸检测器准确率的关键点在于增强微小人脸的检测，因此为微小人脸增加更多的样本数据显得尤为而重要。

传统裁剪Patch的做法是，在数据增强步骤，在原始图像的短边集合[0.3, 1.0] 以随机大小从原始图像进行裁剪。

本文提出的SR则是扩大了此随机比例，将随机比例从[0.3, 1.0] 扩大到[0.3, 2.0] ，这样可以获得更多尺寸小于32的人脸，便于训练检测微小人脸的分支。如上图(b)，红色的为实施了此方法之后的人脸大小的数量分布，蓝色的为传统做法的人脸分布，明显可以看出在实施了SR方法之后的，微小人脸的数量增多。