MTCNN人脸检测

MTCNN人脸检测的原理

MTCNN(Multi-task convolutional neural networks)是论文Joint Face Detection and Alignment using Multi-taskCascaded Convolutional Networks中提出的一种人脸检测算法,论文首页地址:https://kpzhang93.github.io/MTCNN_face_detection_alignment/.

论文的主要思想是,使用多个CNN的级联架构整合人脸检测和人脸关键点两个任务。总体可分为三个阶段,每个阶段对应一个CNN。第一阶段,通过浅层CNN快速生成候选窗口;第二阶段,由更复杂的CNN过滤掉大量非人脸窗口来精选窗口;第三阶段,使用更强大的CNN再次从候选窗口中筛选掉部分窗口,细化窗口结果并输出5个面部关键点位置。

MTCNN人脸检测的总体流程图如下图所示。

在这里插入图片描述
将给定图像调整到不同的比例,作为级联框架的输入。阶段一:使用Proposal Network(p-Net)的全卷积网络来获得候选面部窗口及其边界框回归向量,然后使用边界框回归向量校准候选窗口。接下来采用非极大值抑制(NMS)去除高度重叠的候选窗口。P-Net的网络结构如下图所示。

阶段二:将P-Net输出的所有候选窗口送到另一个CNN中进行训练,称为优化网络(Refine Network,R-Net)。同样使用边界框回归优化候选窗口和NMS,进一步丢弃大量错误候选窗口。R-Net在网络最后使用了全连接层,其网络结构如图所示。

阶段三:使用O-Net(Output Network)输出最终的人脸窗口和5个面部关键点位置,作用和R-Net一样,其网络结构比R-Net多了一层卷积层,这使得网络获得了更好的表达能力。O-Net的网络结构如下图所示。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值