目标检测：SPP-net

最新推荐文章于 2024-09-02 14:58:59 发布

枫桥夜泊1003

最新推荐文章于 2024-09-02 14:58:59 发布

阅读量68

点赞数

文章标签：深度学习

本文链接：https://blog.csdn.net/m0_60341379/article/details/120715913

版权

本文探讨了CNN在目标检测中因固定输入尺寸导致的精度损失和R-CNN的计算冗余问题。SPP-net通过在卷积层和全连接层间引入Spatial Pyramid Pooling，解决了这一挑战，实现了对不同尺寸输入的适应，同时减少了计算负担。通过在conv5层的特征图上应用SPP层，将特征转换为固定长度的向量，用于后续的全连接层处理。

摘要由CSDN通过智能技术生成

该文章主要改进两点：
1. CNN需要固定输入图像的尺寸，导致不必要的精度损失
2. R-CNN对候选区域进行重复卷积计算，造成计算冗余

1.为什么CNNs要固定输入图像的尺寸？

CNN主要有两部分组成：卷积层和全连接层。卷积层以滑动窗口方式操作并输出表示各个响应激活空间分布的特征图。实际上，卷积层不需要输入的图像尺寸固定，并且可以产生任意尺寸的特征图。但另一方面，完全连接层需要具有固定大小/长度的输入。因此，固定输入大小的约束只是来自存在于网络更深层阶段的全连接层。
解决办法(对比R-CNN, SPP-net)：

R-CNN	SPP-net
固定输入图像的尺寸，在将图像输入CNN前，进行图片的缩放(详细情况查看R-CNN文章详细解读)，这样会导致裁剪区域可能不包含整个对象，或者缩放时候产生的扭曲可能会导致不必要的几何失真	提出空间金字塔池化层简称SPP层，在最后一个卷积层的顶部添加一个SPP层。 SPP层对这些特征进行池化并生成固定长度的输出，然后将其输入到完全连接层（或其他分类器）。

在最后的卷积层和全连接层之间加入SPP层。具体做法是，在conv5层得到的特征图是256层࿰

最低0.47元/天解锁文章

枫桥夜泊1003

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
目标检测：SPP-net

该文章主要改进两点：1. CNN需要固定输入图像的尺寸，导致不必要的精度损失2. R-CNN对候选区域进行重复卷积计算，造成计算冗余1.为什么CNNs要固定输入图像的尺寸？CNN主要有两部分组成：卷积层和全连接层。卷积层以滑动窗口方式操作并输出表示各个响应激活空间分布的特征图。实际上，卷积层不需要输入的图像尺寸固定，并且可以产生任意尺寸的特征图。但另一方面，完全连接层需要具有固定大小/长度的输入。因此，固定输入大小的约束只是来自存在于网络更深层阶段的全连接层。解决办法(对比R-CNN, SP
复制链接

扫一扫