论文题目:《HAMBox: Delving into Online High-quality Anchors Mining for Detecting Outer Faces》
论文地址:https://arxiv.org/abs/1912.09231.pdf
发表时间:2020 CVPR
key words
- out faces::异常人脸,由于人脸尺度过小或者人脸尺度与anchor尺度不匹配,造成训练时匹配不到足够多的Anchor(小于阈值K),影响了这些人脸的召回。
- Online High-quality Anchor Mining Strategy: 在线高质量锚框挖掘策略。
- high-quality anchor: 如果某个 Anchor 经过网络回归后的框与人脸框的 GT 的i IoU 大于0.5,则称其为高质量 Anchor。
- matched anchor: 在训练时,与目标人脸的 IoU≥0.35 的anchor。
- unmatched anchor: 在训练时,与目标人脸的 IoU<0.35 的anchor。
- PBB: represents ‘Predicted Bounding Boxes’,即Anchor 经过回归后的框。
- CPBB: Correctly Predicted Bounding Boxes,Anchor 经过回归后能与 GT 的 IoU≥0.5,则称其为CPBB,即 matched high-quality anchor 回归后的框。
Abstract
在较大位姿和尺度变化下的人脸检测器的定位,有效的anchor设计和匹配策略是关键。但是作者发现,在前向过程中(预测时),超过80%的正确的预测框(CPBB:IoU>=0.5)都是从未匹配的 anchor(IoU<0.35)中回归来的。这表明了未匹配的锚框具有出色的回归能力,但是现有的方法中并没有对他们进行学习。
作者提出了HAMBOX,一种在线高质量锚框挖掘策略。
1. Introduction
人脸检测的难点: 人脸的aspect ratio变化很小 ,但是scale尺度变化很大。
目前SOTA的算法是用FPN+dense anchor的方法,但是anchor的增加会使得推理 消耗大大增加,并且anchor的aspect也需要设计。 S 3 F D S^3FD S3FD在每一个stage使用的单一尺度和scale策略,但是选择合适的aspect ratio是个很大的挑战
- the average number of anchors matched to each face: Figure 1(a)表明可以通过增加 Anchor 的尺度来增加 GT 匹配的 Anchor 的数目(小目标匹配的 Anchor 数量少,大目标匹配的 Anchor 数量多)
- the proportion of all faces that can match the anchors: Figure 1(b) 则表明,单纯的增加 Anchor 的尺度到后期会导致匹配失败(一般是小目标无法匹配)的数量增加。
每个人脸所匹配的an