选择性细化网络用于高性能人脸检测

最新推荐文章于 2023-01-14 21:46:22 发布

计算机视觉研究院

最新推荐文章于 2023-01-14 21:46:22 发布

阅读量515

点赞数

本文链接：https://blog.csdn.net/gzq0723/article/details/100977762

版权

640?wx_fmt=gif

人脸检测

人脸检测是自动人脸识别系统中的一个关键环节。早期的人脸识别研究主要针对具有较强约束条件的人脸图象（如无背景的图象），往往假设人脸位置一直或者容易获得，因此人脸检测问题并未受到重视。

随着电子商务等应用的发展，人脸识别成为最有潜力的生物身份验证手段，这种应用背景要求自动人脸识别系统能够对一般图象具有一定的识别能力，由此所面临的一系列问题使得人脸检测开始作为一个独立的课题受到研究者的重视。今天，人脸检测的应用背景已经远远超出了人脸识别系统的范畴，在基于内容的检索、数字视频处理、视频检测等方面有着重要的应用价值。

导读

高性能人脸检测仍然是一个非常具有挑战性的问题，特别是在有很多小尺度人脸的情况下。今天分享的作者就提出了一种新的single-shot人脸检测方法-选择性细化网络(SRN)，它将新的两步分类和回归操作选择性地引入到基于锚点的人脸检测器中，以减少假阳性，同时提高定位精度。

特别是SRN由两个模块组成：选择性两步分类(STC)模块和选择性两步回归(STR)模块。STC的目的是从低层检测层中筛选出大多数简单的负样本锚，以减少后续分类器的搜索空间，而STR的目的是粗略地调整高层次检测层中锚的位置和大小，以便为后续的回归器提供更好的初始化。

此外，还设计了一个感受野增强(RFE)模块，以提供更多样化的感受野，这有助于更好地捕捉一些极端姿势的面孔。因此，所提出的SRN检测器在所有广泛使用的人脸检测基准(包括AFW、PASCAL人脸、FDDB和WIDER FACE数据集)上都取得了最优的性能。

相关工作背景

上世纪90年代，人脸检测就是一个极具挑战性的研究领域。Viola和Jones首先使用Haar特征和Adaboost对人脸检测器进行训练，具有很好的准确性和效率，之后激发了几种不同的方法(【1】Liao, S.; Jain, A. K.; and Li, S. Z. 2016. A fast and accurate unconstrained face detector. TPAMI；【2】Brubaker, S. C.; Wu, J.; Sun, J.; Mullin, M. D.; and Rehg, J. M. 2008. On the design of cascades of boosted ensembles）。除了那些之外，另一个重要的工作是引入可变形的部件模型（DPM）。

最近，基于CNN的方法已经在人脸检测占据了重要位置。Cascade CNN通过训练一个复杂的CNN提高了检测精度。Qin等人建议对级联的CNNs进行联合训练，实现端到端优化（Qin, H.; Yan, J.; Li, X.; and Hu, X. 2016. Joint training of cascaded CNN for face detection. In CVPR.）。MTCN提出了多任务级联的检测和对齐方法。Faceness将人脸检测作为对人脸部件进行评分，以检测严重遮挡下的人脸。UnitBox引入IoU损失用于边界框预测。EMO提出了一个预期的最大重叠分数，以评估锚匹配质量。SAFD开发了一个尺度候选阶段，该阶段自动标准化检测前的人脸尺寸。SSAP注意力在图像金字塔中的特定比例和每个刻度层中的有效位置。最近的工作(Bai, Y.; Zhang, Y.; Ding, M.; and Ghanem, B. 2018. Finding tiny faces in the wild with generative adversarial network. In CVPR)设计了一种新的网络，从一个很小的模糊中以直接产生清晰的超分辨率人脸。

此外，人脸检测还继承了一般目标检测器的一些成就，如 Faster RCNN、SSD、FPN和RetinaNet 。

Face R-CNN（Ren, S.; He, K.; Girshick, R. B.; and Sun, J. 2017. Faster R-CNN: towards real-time object detection with region proposal networks. TPAMI）将Faster R-CNN 与难样本挖掘结合起来，并取得了优秀的结果。Face Boxes引入了一种基于SSD的CPU实时检测器。Face R-FCN在人脸检测中应用R-FCN ，并做出相应的进行改进。人脸检测模型为了寻找微小人脸为不同的尺度训练单独的探测器。S3FD在SSD上提出了多种策略，以补偿小面孔的匹配问题。SSH在每个预测模块上使用大型过滤器对上下文信息进行建模。PyramidBox利用具有改进的SSD网络结构的上下文信息。FAB提出了一个anchor-level的注意力引入RetinaNet，以检测被遮挡的人脸。

作者受RefineDet中的多步分类和回归启发和RetinaNet的focal loss，开发了一种最先进的人脸检测器。

主框架