目标检测之SPP--spatial pyramid pooling layer

最新推荐文章于 2022-11-15 23:13:58 发布

swan777

最新推荐文章于 2022-11-15 23:13:58 发布

阅读量1k

点赞数

文章标签：目标检测

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/swan777/article/details/98476181

版权

SPP-Net通过在卷积层后添加SPP层，解决了目标检测中不同尺寸输入导致的精度问题。它采用多尺度池化，将任意尺寸的特征图转换为固定长度的向量，从而允许直接输入到全连接层。在训练时，使用共享参数的多尺寸网络，而在测试阶段，直接对不同尺寸的图像应用SPP层。SPP层通过max pooling在特征图上形成1x1、2x2、4x4的金字塔结构，输出固定长度的特征向量，有效提高了检测精度。

摘要由CSDN通过智能技术生成

crop就是从一个大图扣出网络输入大小的patch，比如227×227

warp就是把一个边界框bounding box的内容resize成227×227

但warp/crop这种预处理，导致的问题要么被拉伸变形、要么物体不全，限制了识别精确度。没太明白？说句人话就是，一张16:9比例的图片你硬是要Resize成1:1的图片，你说图片失真不？

SPP Net训练和测试的方法基本一样

一张任意尺寸的图片，在最后的卷积层conv5可以得到特征图。根据Region proposal步骤可以得到很多候选区域，这个候选区域可以在特征图上找到相同位置对应的窗口，然后使用SPP，每个窗口都可以得到一个固定长度的输出。将这个输出输入到全连接层里面。这样，图片只需要经过一次CNN，候选区域特征直接从整张图片特征图上提取。在训练这个特征提取网络的时候，使用分类任务得到的网络，固定前面的卷积层，只微调后面的全连接层。

在检测的后面模块，仍然和R-CNN一样，使用SVM和边框回归。SVM的特征输入是FC层，边框回归特征使用SPP层。

最低0.47元/天解锁文章

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。