本文介绍的人脸检测方法,来源于2015CVPR《A Convolutional Neural Network Cascade for Face Detection》。本篇文章的方法可以说是对经典的Viola jones方法的深度卷积网络实现,并没有让人眼前一亮的地方,但依然有以下几点可以学习。
(1)网络级联
下图是该方法的整个流程示意图,可以明显看出是3阶级联(12-net、24-net、48-net)。
级联的工作原理和好处:
1、最初阶段的网络可以比较简单,判别阈值可以设得宽松一点,这样就可以在保持较高召回率的同时排除掉大量的非人脸窗口;
2、最后阶段网络为了保证足够的性能,因此一般设计的比较复杂,但由于只需要处理前面剩下的窗口,因此可以保证足够的效率;
3、 级联的思想可以帮助我们去组合利用性能较差的分类器,同时又可以获得一定的效率保证。
下图展示了,3阶段平均剩下的窗口数量及对应的召回率:
(2)多尺度特征
下图是3阶网络的具体网络结构: