人脸检测（三）——Multi-task CNN（MTCNN）

最新推荐文章于 2024-03-11 09:29:39 发布

Daisy_HJL

最新推荐文章于 2024-03-11 09:29:39 发布

阅读量8.3k

点赞数 2

分类专栏： Facial landmark Detection 文章标签： MTCNN Joint Face Detection

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_28618765/article/details/78127967

版权

本文详细介绍了《Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks》中提出的MTCNN方法，该方法在人脸检测和特征点定位上表现出优越性能，并具有实时处理能力。通过三阶段级联网络（P-Net, R-Net, O-Net）逐步细化任务，结合在线困难样本生成策略，提升了检测准确性。MTCNN使用交叉熵和欧式距离损失函数，根据不同阶段调整任务权重，优化人脸检测和定位效果。" 125388692,12361874,智能控制在配电室环境监控中的应用,"['电力运维', '智能监控', '物联网', '配电室管理', '环境监控']

摘要由CSDN通过智能技术生成

这篇文章主要记录了《Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks》链接

在人脸检测和特征点定位的任务上，这篇文章提出的方法比现有最先进的技术有明显的额提升，而且具有实时处理的性能。

在这篇文章中，提出了一个深度卷积多任务的框架，这个框架利用了检测和对准之间固有的关系来增强他们的性能。特别是，在预测人脸及脸部标记点的时候，通过三阶的级联卷积神经网络对任务进行从粗到精的处理。而且还提出了一种新的在线困难样本生成策略来进一步提升性能。

论文最主要的一点应该是三阶的级联卷积神经网络。我们应该能从下图直观地看出其特点：

stage 1（P-Net）：一个浅层的全部由卷积层组成的CNN快速生成候选窗口，获取候选人脸窗口以及人脸回归向量，再基于估计的边框进行校准，之后才有NMS来合并高度重叠的候选。

stage 2（R-Net）：用stage1得出的结果，放到R-Net进一步排除大量错误的候选，使用边框回归执行校准并进行NMS。

stage 3（O-Net）：这个和stage 2 有点类似，但是这个阶段目的是识别出更准确的脸部区域，最后输出5个特征点位置。

最低0.47元/天解锁文章

关注

2
点赞
踩
25

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。