Scale-Aware Face Detection阅读笔记

最新推荐文章于 2024-06-18 09:42:37 发布

研究僧m0_37600149

最新推荐文章于 2024-06-18 09:42:37 发布

阅读量1.2k

点赞数 1

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_37600149/article/details/78294455

版权

深度学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

https://arxiv.org/pdf/1706.09876.pdf

论文中通过两步来实现多尺度的人脸检测

Face Scale Estimation
Single Scale Detection

首先，估计出图片中存在的人脸的尺度，并且计算出每个尺度的置信度，再选取置信度高的，在这些特定的尺度上对人脸进行检测。这样的方法不用在各个尺度下对人脸进行检测，因此在速度上会比较快。

1.Scale Proposal Network(SPN)

第一步的尺度估计用的是一个FCN全卷积网络（可以参考http://blog.csdn.net/fate_fjh/article/details/53446630），网络输出的是一个尺度响应的heatmap(of size w × h × z),在网络的最后是一个global max-pooling layer,通过pooling输出一个1 × 1 × n的直方图向量。SPN可以忽略input size and face location，产生一个固定维度的尺度直方图，从而得到每个尺度对应的confidence。输出数据的长度就等于直方图bins的个数，并且直方图经过sigmoid函数

归一化到[0, 1]，用来表示probability.

2.Scaling strategy generation

在上一步中得到的直方图向量可能会有噪声，所以接下来要利用滑动平均滤波来进行处理，最后在利用非极大值抑制算法来寻找极大值。滑动的窗口大小等于检测器覆盖范围的一半。

3.Single-scale RPN

这一部分是人脸检测，用的是Region Proposal Network(RPN)(参考论文：https://arxiv.org/pdf/1506.01497.pdf)，只使用一种anchor,并且每次只检测一张脸，所以叫Single-scale RPN.

4.Implementation details

1)global supervision

Loss function:

2)ground truth preparation

人工标注的五官具有一定的主观性，因此将标注的左右眼、鼻子、嘴巴左右端坐标取平均，得到标识框的中心坐标和边长。

如果用0,1来标识是否为人脸，噪声比较多。在比较大的间隔上使用最近邻算法会使SPN的表现drop rapidly甚至是无法收敛。

对于每一个face size s,定义一个高斯函数

3）Receptive field problem

跟RPN不同的是，感受野的限制不会使得网络无法正确检测出较大的目标，因为一张很大的脸的部分特征已近足够估计出完整的脸的大小。

研究僧m0_37600149

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Scale-Aware Face Detection阅读笔记

https://arxiv.org/pdf/1706.09876.pdf论文中通过两步来实现多尺度的人脸检测Face Scale EstimationSingle Scale Detection首先，估计出图片中存在的人脸的尺度，并且计算出每个尺度的置信度，再选取置信度高的，在这些特定的尺度上对人脸进行检测。这样的方法不用在各个尺度下对人脸进行检测，因此在速度上会比较快。
复制链接

扫一扫

专栏目录

研究僧m0_37600149 CSDN认证博客专家 CSDN认证企业博客

码龄7年

11: 原创

118万+: 周排名

121万+: 总排名

2万+: 访问

: 等级

352: 积分

13: 粉丝

13: 获赞

5: 评论

36: 收藏

私信

关注

热门文章

分类专栏

最新评论

Causal Inference in Statistics读书笔记-chapter1
junehedan: 这本书叫什么呀
Causal Inference in Statistics读书笔记-chapter1
何以言易: 最近正在看这本书，写的不错期待新章节
AlphaGo Zero原理浅析
weixin_42322670 回复研究僧m0_37600149: 真的是万分感谢笔者的回答，我自己也有开发一个深度学习的博弈系统，受困于游戏本身带有骰子信息的信息非完备性和训练模型的搭建，我用了简单的Q-learning强化学习策略来self-play，将对弈的数据拿来训练网络，但是毫无效果所以我也猜想MCTS在收集对弈数据的过程中应该起到了至关重要的作用，我正打算搭建MCTS来进行对局模拟，还有就是我强烈希望能得到笔者的联系方式，以便能请教您更多细节上的问题！
AlphaGo Zero原理浅析
研究僧m0_37600149 回复 weixin_42322670: MCTS是一种启发式搜索，它是有选择的扩展节点，不需要遍历所有状态（2^19），通过模特卡洛树搜索得到的样本用来训练策略网络；而利用强化学习的价值网络计算出每个状态的V值，就不需要一直执行到游戏结束才能知道状态的价值，即不需要rollout estimate. (太久没登博客，这么久才回复真是不好意思==)
AlphaGo Zero原理浅析
weixin_42322670: 蒙特卡洛树在神经网络的训练中起到什么作用，两者如何协同工作的

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。