流程总结
首先对MTCNN的整个流程做一个大致的总结:
以上总结是我基于这几天重新预习MTCNN相关知识做的一个归纳,个人一直有点没搞清楚P网络的一些细节。以上总结可能还是有错误,可是学习知识就是一个不断犯错不断更正学习的过程,没有错误就没有进步。如有疏漏,还原纠正。
网络结构
MTCNN人脸检测是一种多级联的人脸检测模型,采用串联的方式级联,通过层层筛选图像中的人脸候选窗口。MTCNN由P-Net 、R-Net、O-Net 三个网络串联组成,下图为三个网络的结构:
1、P-Net
P-Net包含三个卷积层,每个卷积核大小均为3*3,注意到P-Net没有全连接层。
(1)作用:判断是否含有人脸,并给出人脸框的关键点的位置,为O-Net提供人脸候选框。
(2)输入:尺寸大小为12*12的三通道的图像
(3)输出:包含三部分:a.是否人脸概率 1*1 *2向量
b.人脸检测框坐标(左上点和右下点)1*1 *4