【目标检测】感受野

最新推荐文章于 2023-11-07 10:11:43 发布

rrr2

最新推荐文章于 2023-11-07 10:11:43 发布

阅读量190

点赞数

分类专栏：目标检测文章标签：目标检测深度学习计算机视觉

本文链接：https://blog.csdn.net/qq_35608277/article/details/127402321

版权

目标检测专栏收录该内容

90 篇文章 5 订阅

订阅专栏

在这里插入图片描述

所谓的检测网络背后就是一个分类网络而已，并没有什么神奇的地方，检测任务是一个典型的多任务学习：分类+回归，为什么这么说呢？接下来告诉你答案。如下图是一个全卷积网络，输入图像分辨率的改变会导致输出的分辨率有所改变，比如下图右边的部分最后的特征图出来是3×3的。然后检测网络会在输出层上做预测，这个时候就需要同时给出3×3，也就是9个类别标签，也就是要同时预测9幅图像的标签，那这个9幅图像到底是哪9幅图像呢？结合之前的感受野的介绍和计算，来看下图中间的图示，最左边表示的是3×3的特征图上每个位置在原图的感受野中心，这里由红点表示。右边六幅图就分别对应了这3×3位置前两行的感受野信息，这里由绿色的框表示，所以这9幅图像也就是这个九个感受野区域！其实对于检测网络网络的训练可以视为一种高效的分类网络训练，因为一个检测的样本一次可以产生非常多分类的样本，每个分类样本就是感受野对应的图像区域，框的回归其实被当做一件附带的事情给干了，因为无论是one-stage还是two-stage的方法，框的预测都是和类别无关的！也就是大多数只会使用4个feature map，并没有类别信息。

在这里插入图片描述

我们可以把CNN的整个计算过程看成是一个三维的有向图，边的指向是由底层节点指向高层节点（高层指越往后的特征图），有了这个假设然后就可以参考下图红圈中的计算方式了。还可以从梯度反传的角度来看，每条边代表的梯度是同等重要的，所以用边的总数来刻画这个贡献度是十分合理的！
在这里插入图片描述

https://blog.csdn.net/Rolandxxx/article/details/127270974
https://zhuanlan.zhihu.com/p/357914282
https://blog.csdn.net/qq_41621517/article/details/122482583
https://blog.csdn.net/u012862372/article/details/81045593

rrr2

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【目标检测】感受野

如下图是一个全卷积网络，输入图像分辨率的改变会导致输出的分辨率有所改变，比如下图右边的部分最后的特征图出来是3×3的。结合之前的感受野的介绍和计算，来看下图中间的图示，最左边表示的是3×3的特征图上每个位置在原图的感受野中心，这里由红点表示。其实对于检测网络网络的训练可以视为一种高效的分类网络训练，因为一个检测的样本一次可以产生非常多分类的样本，每个分类样本就是感受野对应的图像区域，框的回归其实被当做一件附带的事情给干了，因为无论是one-stage还是two-stage的方法，框的预测都是和类别无关的！
复制链接

扫一扫

专栏目录