人脸检测中，如何构建输入图像金字塔

最新推荐文章于 2019-07-19 22:40:26 发布

shine-lee

最新推荐文章于 2019-07-19 22:40:26 发布

阅读量1.7k

点赞数 3

分类专栏：人脸识别文章标签：人脸检测

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/blogshinelee/article/details/84789366

版权

博客：blog.shinelee.me | 博客园 | CSDN

文章目录

写在前面
人脸检测中的图像金字塔
代码实现
- MTCNN
- Seetaface
总结
参考

写在前面

在文章《特征，特征不变性，尺度空间与图像金字塔》中我们初步谈到了图像金字塔，在这篇文章中将介绍如何在人脸检测任务中构建输入图像金子塔。

人脸检测中的图像金字塔

人脸检测任务，输入是一张图像，输出图像中人脸所在位置的Bounding Box。因为卷积神经网络强大的特征表达能力，现在的人脸检测方法通常都基于卷积神经网络，如MTCNN等。网络确定后，通常只适用于检测一定尺寸范围内的人脸，比如MTCNN中的P-Net，用于判断 $12 \times 12$ 大小范围内是否含有人脸，但是输入图像中人脸的尺寸是未知的，因此需要构建图像金字塔，以获得不同尺寸的图像，只要某个人脸被放缩到 $12\times12$ 左右，就可以被检测出来。下图为MTCNN 的Pipeline，来自链接。

MTCNN Pipeline

构建金字塔需要解决几个问题：

金字塔要建多少层，即一共要生成多少张图像
每张图像的尺寸如何确定

下面直接从代码层面看是如何实现的，也可以直接跳到总结查看结论。

代码实现

MTCNN

以下为MTCNN 人脸检测 matlab代码
MTCNN detect face code

在人脸检测，通常要设置要原图中要检测的最小人脸尺寸，原图中小于这个尺寸的人脸不必care，MTCNN代码中为minsize=20，MTCNN P-Net用于检测 $12\times12$ 大小的人脸。如果输入图像为 $100 \times 120$ ，其中人脸最小为 $20 \times 20$ ，最大为 $100 \times 100$

最低0.47元/天解锁文章

关注

3
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
人脸检测中，如何构建输入图像金字塔

博客：blog.shinelee.me | 博客园 | CSDN文章目录写在前面人脸检测中的图像金字塔代码实现MTCNNSeetaface总结参考写在前面在文章《特征，特征不变性，尺度空间与图像金字塔》中我们初步谈到了图像金字塔，在这篇文章中将介绍如何构架人脸检测任务中的输入图像金子塔。人脸检测中的图像金字塔人脸检测任务，输入是一张图像，输出图像中人脸所在位置的Bounding Box。...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。