FaceBoxes的学习笔记

最新推荐文章于 2020-09-29 09:30:07 发布

songyuc

最新推荐文章于 2020-09-29 09:30:07 发布

阅读量258

点赞数

分类专栏：人脸检测人脸检测与识别文章标签： FaceBoxes

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/songyuc/article/details/103378857

版权

人脸检测同时被 2 个专栏收录

3 篇文章 0 订阅

订阅专栏

人脸检测与识别

2 篇文章 0 订阅

订阅专栏

1 致谢

感谢赵老师的讲授。

2 前言

FaceBoxes是一种用来进行人脸检测的算法框架，我个人感觉还是比较好的，吸收了SSD的一些优点。

3 FaceBoxes的论文阅读

3.3. Anchor densification strategy

在3.3节中，论文主要讲到了，锚点致密化策略，

在阅读时，我看到一个概念不太清楚，
在这里插入图片描述
这部分文字说到，对于Conv3_2卷积层，这里的 stride size为64像素，这里我不太明白 stride size的含义，其实，它指的是不同锚点之间相距的步长，我把它称作锚间步长，其大小跟当前卷积层的 feature map的大小相关，还是以Conv3_2卷积层为例，其输出 feature map的大小为16x16，则对于特征图中的每一个像素点，与其相邻像素点对应的感受野的中心的距离，即为输入图像1024/16 = 64，即两个相邻感受野的步长间距，同时也是两个相邻锚的间距；

3.4 Loss函数

回归任务采用的是 smooth $L_1$ loss函数，其公式为：
$smooth_{L_1}(x)= \left\{\begin{matrix} 0.5x^2 & \text{if} \left | x \right | < 1\\ \left | x\right |-0.5 & \text{otherwise}\\ \end{matrix}\right.$

4 FaceBoxes的代码学习

4.1 网络架构

Inception模块需要自己定义，PyTorch没有提供Inception模块的封装类；

4.2 模型训练

FaceBoxes仅支持1024x1024图片的训练；

4.3 补充资料

4.3.1 cfg配置参数

steps：描述了三个输出模块的特征图的步长。

这里三个输出模块是指：Inception3、Conv3_2和Conv4_2三个模块；

steps的三个值32, 64, 128是跟网络结构有关的，根据网络结构计算出来的；
3.2.1 encode操作

encode是SSD中提出的一种特殊操作。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
FaceBoxes的学习笔记

1 致谢感谢赵老师的讲述。2 前言FaceBoxes是一种用来进行人脸检测的算法框架，我个人感觉还是比较好的，吸收了SSD的一些优点。3 FaceBoxes的论文阅读3.3. Anchor densification strategy在3.3节中，论文主要讲到了，锚点致密化策略，在阅读时，我看到一个概念不太清楚，这部分文字说到，对于Conv3_2卷积层，这里的 stride siz...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。