SSH: Single Stage Headless Face Detector
单阶段无头人脸检测器
SSH能够在移除VGG16的全连接层的同时实现最先进的结果 。
SSH整体结构:
detection module包含一个用于检测人脸和定位的回归器(regressor,求得目标框的位置)和 一个卷积二值分类器(binary classifier,用于判断该目标框中是不是目标)。
三个检测模块 M1、M2、M3 在feature map基础上分别使用stride为8、16、32进行操作。
关于bbox回归的任务,每个地方有K个不同尺度的 anchor,文中提到在人脸检测任务中anchor的长宽比固定就行,多样的比例对检测结果没有明显的影响,feature map 大小为 Wi × Hi,总共有 Wi × Hi × K个anchor。
detection module中的context module用来提升感受野的影响,Wi × Hi × Ki × 2用于表示bbox的分类结果, Wi × Hi × Ki × 4 用于表示bbox的回归结果
尺度不变性设计:
通过在不同stride的feature map上检测small、medium、large人脸解决目标多尺度的问题。具体是:
对VGG-16网络中conv4-3的输出使用M1进行检测,stride为8,检测small face;
对VGG-16网络中conv5-3的输出使用M2进行检测,stride为16,检测medium face;
对VGG-16网络中conv5-3池化后的输出使用M3进行检测,stride为32,检测large face。
context模块:
context module使用3×3的卷积核序列来实现5×5以及7×7的卷积核效果, context module能够提升检测性能。