「Computer Vision」Note on MTCNN

Sina Weibo:小锋子Shawn
Tencent E-mail:403568338@qq.com
http://blog.csdn.net/dgyuanshaofeng/article/details/81024957

如下图1所示,为MTCNN[1]的测试过程。主要涉及1次resize处理,3个卷积网络计算,3次非最大值抑制处理、包围盒矫正。
(1) resize处理主要对图像进行金字塔缩小,为了对抗scale变异性,其实还可以像FPN[2]那样采用特征金字塔处理。
(2) 3个卷积网络分别是proposal network (P-Net)、refine network (R-Net)和output network (O-Net),级联思想,由粗到精地回归包围盒,并输出特征点。
(3) 上述3个卷积网络经过计算之后,紧接着进行NMS和包围盒矫正(利用offsets)。
这里写图片描述

图 1

如图2所示,为MTCNN中3个网络的具体结构,都是非常简单的。因此MTCNN不但参数少,并且速度非常快,是最近1-2年中性能较好的人脸检测器。
这里写图片描述

图 2

训练阶段比较tricky,可以参考目前的重现训练。

[1] Joint Face Detection and Alignment Using Multi-task Cascaded Convolutional Networks SPL 2016 [paper] [inference code based Matlab/Caffe] [inference code based Pytorch] [inference code based Tensorflow]
[2] Feature Pyramid Networks for Object Detection CVPR 2017 [paper]

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值