DSFD为19年腾讯提出的,用于人脸检测的轻量级实时模型,全称为Dual Shot Face Detector。接下来会给出模型的大结构,然后针对模型的创新点结合代码进行重点分析。
首先论文的效果图如下:
模型结构如下:
模型的输入像素为640,模型结构采用single stage doul shot,backbone网络采用vgg16,类似于PyramidBox或S3FD网络,选择conv3_3,conv4_3,conv5_3,conv_fc7, conv6_2和conv7_2作为First Shot PAL的原始特征输入,以及通过FEM模块生成对应的ef1,ef2,ef3,ef4,ef5,ef6作为Second Shot PAL的特征输入。接下来重点分析模型主要有三个创新点。