目标检测(人脸识别)经典算法—MTCNN(Multi-task Cascaeded Convolutional Networks)

多任务级联卷积网络

该网络可以称之为目标检测应用的开山之作。但是由于其网络层次复杂,识别速度慢,目前的工程领域并不常用,其核心思想却在各个常用的目标检测算法中经常使用。
一、图像金字塔

当网络对一张图片进行特征提取时,我们设定的框往往不能够框住图片上的目标(对于任意一张图片我们并不知道目标在图片上所占的比例),如下图所示,由于设定窗口(蓝框)太小,无论如何移动,也框不到我们想得到的人脸。
在这里插入图片描述
使用图像金字塔对图片进行缩放,如下图,当被缩放图片的最小边长小于设定框时,x<a时,结束操作。此时设定框可以选定图像上不同大小的目标(同时也会产生过多的候选框)。
在这里插入图片描述
二、IOU(交并比、重叠度)
在这里插入图片描述
如上图所示,红色框为真实框A,绿色框为预测框B。IOU表示两个框的重叠度。公式如下:
在这里插入图片描述
IOU的计算为NMS提供基础。
三、NMS(非极大抑制)
文章中所提到的NMS方法,在其他很多地方应用也很广。
在这里插入图片描述
这是举例说明,我们首先选取0.98的框,将其他所有框的得分与0.98做IOU,设定阈值为0.3,与0.98做IOU大于0.3的框被淘汰,其余保留。很明显,左一0.75和0.85框都被淘汰(抑制)。0.98被保留,剩下其余六个框。其中0.90最大,剩下的得分再与0.90做IOU,同上。以此循环。最后剩下的框不一定是三个,至于为什么可以自己领悟。
四、P-Net(proposal Net)
在这里插入图片描述
在这里插入图片描述
经过前面的图像金字塔处理,通过一个FNC进行初步特征提取与标定边框,并通过NMS对大部分窗口进行过滤,Bound ing-Box Regression调整窗口。
P-Net 是一个人脸区域建议网络,将提取到的特征输入该网络的三个卷积层后,通过一个分类器判断该区域是否存在人脸,同时使用Bound ing-Box Regression和面部关键点的定位器来初步标记人脸区域.P网络中将输出很多可能存在人脸的候选框,交给R-Net做处理.(此时可以将P-Net预想为公司招聘时的HR面,只是将可能存在脸部的框保留了下来,并没有考虑精度)

五、R-Net(Refine Net)
在这里插入图片描述
相比第一层P-Net,在第二次卷积之后增加了一个池化层,最后一次卷积完后增加了一个全连接层.R-Net网络将过滤掉输入进来的效果不好的候选框,最后对选定的候选框进行Bound ing-Box regression和NMS进一步优化预测结果.
六、O-Net(Output Net)
在这里插入图片描述
结构上相比于R-Net 多了一个卷积层和一个池化层,全连接层也由128增加到256.此时会通过更多的监督进行识别面部的区域.而且会对人的面部特征点进行回归,最终输出五个人脸面部特征点.

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
几篇CVPR关于multi-task的论文笔记整理,包括 一、 多任务课程学习Curriculum Learning of Multiple Tasks 1 --------------^CVPR2015/CVPR2016v--------------- 5 二、 词典对分类器驱动卷积神经网络进行对象检测Dictionary Pair Classifier Driven Convolutional Neural Networks for Object Detection 5 三、 用于同时检测和分割的多尺度贴片聚合(MPA)* Multi-scale Patch Aggregation (MPA) for Simultaneous Detection and Segmentation ∗ 7 四、 通过多任务网络级联实现感知语义分割Instance-aware Semantic Segmentation via Multi-task Network Cascades 10 五、 十字绣网络多任务学习Cross-stitch Networks for Multi-task Learning 15 --------------^CVPR2016/CVPR2017v--------------- 23 六、 多任务相关粒子滤波器用于鲁棒物体跟踪Multi-Task Correlation Particle Filter for Robust Object Tracking 23 七、 多任务网络中的全自适应特征共享与人物属性分类中的应用Fully-Adaptive Feature Sharing in Multi-Task Networks With Applications in Person Attribute Classification 28 八、 超越triplet loss:一个深层次的四重网络,用于人员重新识别Beyond triplet loss: a deep quadruplet network for person re-identification 33 九、 弱监督级联卷积网络Weakly Supervised Cascaded Convolutional Networks 38 十、 从单一图像深度联合雨水检测和去除Deep Joint Rain Detection and Removal from a Single Image 43 十一、 什么可以帮助行人检测?What Can Help Pedestrian Detection? (将额外的特征聚合到基于CNN的行人检测框架) 46 十二、 人员搜索的联合检测和识别特征学习Joint Detection and Identification Feature Learning for Person Search 50 十三、 UberNet:使用多种数据集和有限内存训练用于低,中,高级视觉的通用卷积神经网络UberNet: Training a Universal Convolutional Neural Network for Low-, Mid-, and High-Level Vision using Diverse Datasets and Limited Memory 62 一共13篇,希望能够帮助到大家
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值