CVPR 2017论文《Scale-Aware Face Detection》学习

最新推荐文章于 2022-11-24 14:41:15 发布

Genera1Z

最新推荐文章于 2022-11-24 14:41:15 发布

阅读量365

点赞数 1

文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u010175803/article/details/89843635

版权

CVPR 2017论文《Scale-Aware Face Detection》学习（点此下载）。

文章目录

0 Abstract
1 Introduction
2 Related works
3 Scale-aware detection pipeline
4 Implementation details
5 Experiments
6 Conclusion

0 Abstract

CNN不擅长处理多尺度的人脸，要么用具备多尺度感知能力的单个大模型，要么借助图像金字塔多次通过一个模型。这俩都耗费计算。作者提出SAFD尺度感知人脸检测器，明确地处理尺度问题，精度更高负荷更小。

具体做法是：在检测前先通过高效的CNN预测人脸尺度直方图，以指导图像缩放；由于缩放后的目标尺度一致，所以可以通过一个很小的CNN来进行人脸检测。

实验：对AFW，检测出了其中99%的脸，而每张图像缩放级数平均不到两级。还在FDDB，MALF上进行了充分实验。

1 Introduction

人脸检测中的尺度问题并没有被很好的讨论，还有很大提升空间。处理尺度的两个思路是：加大CNN容量，或者缩放更多级金字塔。前者需要把图像送入一个大模型一次（单次多尺度），后者需要把图像（的不同缩放）送入一个小模型多次（多次单尺度）。

作者采用多次单尺度的思路，直接把图像缩放到适合模型的大小，跳过图像金字塔中无价值的级。即，先估计人脸尺度，缩放后进行单尺度人脸检测。

具体而言，第一阶段，用尺度提议网SPN估计人脸尺寸。实现为全卷积、以全局最大池化结尾，输出固定长度的向量；可通过图像级gt直方图向量监督训练，不需要人脸位置信息。

第二阶段，进行单尺度人脸检测。实现为RPN；训练时把人脸缩放到相同的尺度，从而用一个较小的CNN也能达到较高性能。

使用该两阶可感知尺度的区域提议网SARPN，计算量小且精度高。其原因很明显：用小网络处理单尺度，比多尺度性能更好；而大尺度的人脸可以通过缩小来避免无效计算。

Contributions

把人脸检测任务分成两个子问题：尺度估计和单尺度检测。减少了运算量。
提出SPN，进行精细尺度估计。而该网络很容易在图像级监督上进行训练。

图1 单尺度检测器需要在图像金字塔上进行检测，从而涵盖不同尺度的人脸。然而图像金字塔的大部分级是无效的（红线箭头），只有少部分有效（绿线箭头）。在无效的级上进行检测浪费计算。作者提出用CNN先估计人脸的有效尺度，进而可以剔除这些无效级，显著地减少运算量。

2 Related works

已有一些方法成功地处理了尺度：融合不同层的特征图之后检测；直接用不同层的特征图进行检测。

他们的思路都是：打脸需要大感受野，小脸需要小感受野（更高的分辨率）。

他们的弊端有两点：不能明确地共享不同尺度间的特征（只是模糊地共享网络的不同层），需要更多参数来处理更大范围的人脸；要一次性处理图像中的所有人脸，尤其为了防止丢失小脸而不缩放图像，无效计算太多，有损速度。

3 Scale-aware detection pipeline

图2 SAFD的流程。先把输入图像下采样送入SPN以获得尺度直方图。根据尺度直方图冲采样输入图像。最后把这些图像送入RPN，得到检测结果。

3.1 Scale Proposal Network (SPN)

作者把尺度提议定义为一组估计的人脸尺寸和相应的置信度。前者将在4.2中详谈。SPN在设计目标是以最少的人为约束来产生尺度直方图。

SPN为FCN，以Global Max Pool结尾，把任意输入尺寸固定为定长向量。结构见图3。输入hwn、输出11n，每个元素代表相应尺度的人脸概率。该直方图矢量可看做概率-尺度直方图。矢量的长度代表尺度的数量；概率值由Sigmoid归一化得到。

图3 SPN的构造。以Global Max Pool结尾，可得输出固定维度的尺度矢量。其中每个元素的值表示图像含有相应尺度的人脸的概率。训练时SPN只需要图像级监督。

尺度矢量的详细定义。从左到右有n个尺度段，最小尺度为s₀、最大为s_n，都是log尺度。尺度矢量h为：
在这里插入图片描述

其中x表示某个人脸， $s i z e (x)$ 表示其尺寸。

而 $a_i$ 所处的尺度区间为 $s_i^l, s_i^r)$

最低0.47元/天解锁文章

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
CVPR 2017论文《Scale-Aware Face Detection》学习

这里写自定义目录标题0 Abstract1 Introduction2 Related works3 Scale-aware detection pipeline3.1 Scale Proposal Network (SPN)3.2 Scaling strategy generation3.3 Single-scale RPN4 Implementation details4.1 Global s...
复制链接

扫一扫

Genera1Z CSDN认证博客专家 CSDN认证企业博客

码龄11年

3: 原创

45万+: 周排名

150万+: 总排名

7908: 访问

: 等级

143: 积分

3: 粉丝

8: 获赞

2: 评论

29: 收藏

私信

关注

热门文章

最新评论

试用TensorFlow Serving
Genera1Z 回复静静静雅: 抱歉，才回复。其实我也是新手。
试用TensorFlow Serving
静静静雅: 你好，我在创建客户端时候出现<_Rendezvous of RPC that terminated with (StatusCode.UNAVAILABLE, Connect Failed)> 该怎么办，谢谢

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。