人脸检测(三)——Multi-task CNN(MTCNN)

本文详细介绍了《Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks》中提出的MTCNN方法,该方法在人脸检测和特征点定位上表现出优越性能,并具有实时处理能力。通过三阶段级联网络(P-Net, R-Net, O-Net)逐步细化任务,结合在线困难样本生成策略,提升了检测准确性。MTCNN使用交叉熵和欧式距离损失函数,根据不同阶段调整任务权重,优化人脸检测和定位效果。" 125388692,12361874,智能控制在配电室环境监控中的应用,"['电力运维', '智能监控', '物联网', '配电室管理', '环境监控']
摘要由CSDN通过智能技术生成

这篇文章主要记录了《Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks》链接


在人脸检测和特征点定位的任务上,这篇文章提出的方法比现有最先进的技术有明显的额提升,而且具有实时处理的性能。

在这篇文章中,提出了一个深度卷积多任务的框架,这个框架利用了检测和对准之间固有的关系来增强他们的性能。特别是,在预测人脸及脸部标记点的时候,通过三阶的级联卷积神经网络对任务进行从粗到精的处理。而且还提出了一种新的在线困难样本生成策略来进一步提升性能。


论文最主要的一点应该是三阶的级联卷积神经网络。我们应该能从下图直观地看出其特点:

stage 1(P-Net):一个浅层的全部由卷积层组成的CNN快速生成候选窗口,获取候选人脸窗口以及人脸回归向量,再基于估计的边框进行校准,之后才有NMS来合并高度重叠的候选。

stage 2(R-Net):用stage1得出的结果,放到R-Net进一步排除大量错误的候选,使用边框回归执行校准并进行NMS。

stage 3(O-Net):这个和stage 2 有点类似,但是这个阶段目的是识别出更准确的脸部区域,最后输出5个特征点位置。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值