MTCNN论文阅读笔记

MTCNN是一个基于深度学习的三级联CNN网络,用于人脸检测与对齐。它采用从粗到细的级联多任务框架,结合在线困难样本挖掘策略提升性能。网络包括P-Net、R-Net和O-Net,分别用于初步检测、候选框筛选和精细对齐。在训练过程中,针对不同IoU阈值的样本进行分类和回归损失计算,优化网络性能。
摘要由CSDN通过智能技术生成

论文:Joint Face Detection and Alignment Using Multitask
Cascaded Convolutional Networks

简称MTCNN,是一个用于人脸检测与对齐的三级联CNN网络,把人脸检测与对齐联系起来。

论文主要提出一个从粗到细的级联多任务框架用于人脸的检测与对其,并提出online hard sample mining strategy,该策略可以提升性能。

online hard sample mining strategy:训练过程中,对loss进行排序,根据排序结构选择N个loss值最大的样本进行反向传播,更新权重,即侧重对Loss值大(hard sample)进行权重调整,当然这里由于很多候选框对应的是同一个位置,loss值是相近的,所以针对这个问题,提出的解决方法是:对hard做nms,然后再选择样本反向传播,这里nms选择的IoU=0.7。

引言:
人脸检测的发展历程,先是VJ框架(Haar-Like + AdaBoost),然后再到DPM模型,再到深度学习方法的引入。
人脸对齐的发展历程,一般两种方法:回归,模板拟合方法。
然而,以往的人脸检测和人脸对齐方法忽略了这两种任务之间的内在相关性,虽然已有人试图共同解决这些问题,但这些方案仍然存在局限性。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值