MTCNN论文初读

归一码字

于 2024-05-07 15:58:01 发布

阅读量314

点赞数 4

文章标签：分类 opencv python 计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_46221545/article/details/137878794

版权

MTCNN

前言
一、MTCNN背景
二、MTCNN的网络结构

前言

在复杂且不受约束的环境中，人脸检测和人脸对齐是两项极具挑战性的任务。由于人脸的姿态、光照条件以及可能的遮挡等多种因素。本文提出了一种深度级联多任务框架，该框架充分利用了人脸检测和人脸对齐之间的内在关联性，旨在进一步提升两者的性能。作者设计了一个具有三个阶段的级联结构，每个阶段都包含精心设计的深度卷积网络，用于以由粗到细的方式预测人脸和特征点的位置。

一、MTCNN背景

MTCNN算法设计了一种级联的卷积神经网络结构，通过多个阶段的网络预测，以由粗到细的方式逐步精确定位人脸和特征点的位置。这种结构充分利用了人脸检测和人脸对齐之间的内在关联性，从而实现了性能的提升。

此外，MTCNN还引入了一些创新的学习策略，如在线困难样本挖掘策略，这些策略有助于自动提升性能，无需手动选择样本。这使得MTCNN在应对复杂多变的人脸图像时具有更好的适应性。

综上所述，MTCNN的背景是基于人脸检测和人脸对齐的挑战性问题，通过设计级联的卷积神经网络结构和引入创新的学习策略，实现了性能的提升和更好的适应性。这使得MTCNN在人脸相关的计算机视觉任务中具有重要的应用价值。

二、MTCNN的网络结构

在这里插入图片描述 mtcnn分为三层结构p_net,R_net,O_net。
这三层逐层细分最后的的与之相最为匹配的图像

图像金字塔

每次我们取12*12的像素图像，然而有的人脸是小的或者大的。所以我们需要把图像进行缩放进行检测运算。

p_net

1，首先对图片进行Resize操作，将原始图像缩放成不同的尺度，生成图像金字塔。
然后P_net层削减去一部分不需要的背景P_net如下图的结构
在这里插入图片描述然后对原图和生成出来的p_net再进行操作如下图

结果分为一个二分类的二维数据,和一个4*32的调整数组调整之前·的图像最后加一个NM
S进行极大抑制削减边线框

R_net

在这里插入图片描述
进行更进一步精细操作，减少图片框的范围

o_net

在这里插入图片描述
这里比p_net多出了一个检验人面孔的分类器需要注意

关注

4
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
MTCNN论文初读

在复杂且不受约束的环境中，人脸检测和人脸对齐是两项极具挑战性的任务。由于人脸的姿态、光照条件以及可能的遮挡等多种因素。本文提出了一种深度级联多任务框架，该框架充分利用了人脸检测和人脸对齐之间的内在关联性，旨在进一步提升两者的性能。作者设计了一个具有三个阶段的级联结构，每个阶段都包含精心设计的深度卷积网络，用于以由粗到细的方式预测人脸和特征点的位置。
复制链接

扫一扫

归一码字 CSDN认证博客专家 CSDN认证企业博客

码龄4年

天津理工大学

37: 原创

127万+: 周排名

7万+: 总排名

1万+: 访问

: 等级

490: 积分

134: 粉丝

116: 获赞

8: 评论

109: 收藏

私信

关注

热门文章

最新评论

pandas中的loc函数
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
TensorBoardX学习
CSDN-Ada助手: 恭喜您写了第16篇博客《TensorBoardX学习》，内容相信对很多读者都会有很大帮助。希望您能继续保持创作的激情和努力，探索更多有趣的主题。或许在下一篇博客中，可以分享一些实际应用案例或者深入解读某个TensorBoardX的特性，让读者能够更深入地理解和应用这个工具。期待您的精彩继续呈现！
python多进程
CSDN-Ada助手: 恭喜您写了第15篇博客，内容涉及python多进程，看来您对这个主题有很深入的了解啊！希望您能继续保持创作的热情，也可以尝试探讨一下python多线程的应用，或者深入研究一些与多进程相关的高级技巧，让读者也能从您的博客中学到更多知识。期待您的下一篇作品！
nms_极大抑制
普通网友: 这篇文章是优质之作，内容充实，结构明晰，语言流畅且通俗易懂，适合广大读者阅读。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
nms_极大抑制
普通网友: 优质好文，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。