FaceBoxes是一个人脸检测的轻量级模型,类似于YoloV3模型,采用了archor进行方框预测,FaceBoxes采用高像素1024*1024的图片输入,但在高分辨率输入的情况下,依然能达到实时效果。
下面为论文给出的TABLE及效果图
模型结构如下:
模型使用了常规的卷积conv,池化maxPool,以及InceptionV3中提出的Inception模块,除此之外,模型还使用到CRelu激活函数,快速扩张channel数目。
模型的输出:
模型借鉴了YoloV3的多尺度输出,提