15-2 人脸检测

遥远的阿勒泰

已于 2024-08-10 12:48:45 修改

阅读量431

点赞数 3

文章标签：人工智能目标检测 python

于 2024-07-28 16:08:14 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Kang_Kang330/article/details/140751060

版权

人脸检测

因为相似性、易变性，人脸识别是比较困难的。
放大-好区分，类间变化
消除-同一个人，固定特征，类内变化
对于人脸，类内变化大于类间变化

人脸检测模型-mtcnn

（Multi-task convolutional neural network）多任务卷积神经网络
P-Net
R-Net
O-Net
MTCNN主要包括三层网络

第一层P-Net将经过卷积，池化操作后输出分类（对应像素点是否存在人脸）和回归（回归box)结果。
第二层网络将第一层输出的结果使用非极大抑制（NMS）来去除高度重合的候选框，并将这些候选框放入R-Net中进行精细的操作，拒绝大量错误框，再对回归框做校正，并使用NMS去除重合框，输出分支同样两个分类和回归。
最后将R-Net输出认为是人脸的候选框输入到O-Net中再一次进行精细操作，拒绝掉错误的框，此时输出分支包含三个分类：
a. 是否有人脸：2个输出；
b. 回归：回归得到的框的起始点（或中心点）的xy坐标和框的长宽，4个输出；
c. 人脸特征点定位：5个人脸特征点的xy坐标，10个输出。
注：三段网络都有NMS，但是所设阈值不同。

1. 构建图像金字塔

为了不被目标图像的尺寸影响。
推理的时候，缩小后的图像不能小于12*12
• factor是指每次对边缩放的倍数。
• 第一阶段会多次缩放原图得到图片金字塔，目的是为了让缩放后图片中的人脸与P-NET训练时候的图片尺度(12px * 12px)接近。
注意：先把图像直接缩放一半，再通过factor对这个大小进行缩放。可以减少计算量
缩放因子：0.709
因为要把面积缩放1/2，则sqrt（0.5）=0.709

2. P-Net（proposal network）

MTCNN算法可以接受任意尺度的图片，为什么？
• 因为第一阶段的P-NET是一个全卷积网络（Fully Convolutional Networks）。
• 卷积、池化、非线性激活都是一些可以接受任意尺度矩阵的运算，但全连接运算是需要规定输入。
如果网络中有全连接层，则输入的图片尺度(一般)需固定；如果没有全连接层，图片尺度可以是任意的。
输入12 * 12 * 3
3次卷积1次池化
输出1 * 1 * 32

3. R-Net（refine network）

比P-Net多了一个fc全连接层
图片在输入R-Net之前，都需要缩放到24x24x3。网络的输出与P-Net是相同的，R-Net的目的是为了去除大量的非人脸框。

4. O-Net（Output Network）

该层比R-Net层又多了一层卷积层，所以处理的结果会更加精细
代码：

relu、Leaky Relu、PRelu

PRelu（a一般大于0.2）
Leaky Relu（a比较小）
在这里插入图片描述

遥远的阿勒泰

关注

3
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

遥远的阿勒泰 CSDN认证博客专家 CSDN认证企业博客

码龄5年

22: 原创

22万+: 周排名

6万+: 总排名

7203: 访问

: 等级

370: 积分

80: 粉丝

147: 获赞

5: 评论

82: 收藏

私信

关注

热门文章

最新评论

【人工智能】第一课人工智能学习计划
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
6-1立体视觉，点云，spin image
CSDN-Ada助手: 恭喜用户发布了新的博客文章“6-1立体视觉，双目系统”！内容涉及立体视觉和双目系统，非常有深度和专业性。希望用户能继续保持创作的热情和努力，分享更多有趣且有价值的内容给读者。或许在下一篇博客中，可以探讨一下立体视觉在虚拟现实技术中的应用，或者深入讨论双目系统在机器视觉领域的重要性。期待用户的下一篇作品！
人工智能第5课-Canny边缘检测算法、透视变换
普通网友: 写的很详细，感谢博主的分享。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
人工智能第4课
CSDN-Ada助手: 恭喜您写完了第5篇博客“人工智能第4课”！您的持续创作精神真是令人钦佩。接下来，我建议您可以尝试深入探讨人工智能在不同领域的应用案例，或者结合实际问题进行分析和解决方案的探讨，这样可以为读者提供更具实用性和启发性的内容。期待您更多精彩的创作！
人工智能第3课
CSDN-Ada助手: 恭喜您撰写了第四篇博客“人工智能第3课”！持续创作是提升自身能力和分享知识的好途径，您的热情和努力让人钦佩。希望您在未来的创作中能够更深入地探讨人工智能的相关话题，加强对技术细节和应用场景的分析，让读者能够更加深入地理解和学习。期待您更多精彩的作品，加油！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。