SPP-net(Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition)

最新推荐文章于 2022-11-14 09:33:01 发布

zzh0908

最新推荐文章于 2022-11-14 09:33:01 发布

阅读量536

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zzh0908/article/details/83094710

版权

Abstract

SPP-net提出了空间金字塔池化层来解决CNN只是输入固定尺寸的问题，因为单固定尺寸的输入会影响识别效果，并且对于多尺度图像的情况下鲁棒性不好。SPP-net很好的解决了以上问题，对于任意尺度图像都可以提取出固定维度的特征，实验证明SPP-net对分类任务(不同网络结构)和目标探测任务都有积极的作用。RCNN则是将候选区送入模型，这样会非常耗时，而且SPP-net网络以整张图像作为输入节省了大量时间，速度快了24~64倍。论文网络结构如图所示：

spatial pyramid pooling layer原理图，如图所示输入可以是多种尺寸的，进而得到不同尺寸的特征图，但我们对其平均分成16、4、1份然后进行池化下采样，这样不论特征图是什么尺寸的都可以转换为固定的尺度：

其实，此论文最令人迷惑的点就是特征图---原图的ROI映射，我们根据候选区ROI(原图上的)坐标映射在特征图上响应的区域边框，这样就避免了多次重复的进行特征提取浪费计算力，文章也提到了特征图和原图ROI的映射原理。映射原理是将原图坐标(x,y)映

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
SPP-net(Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition)

Abstract SPP-net提出了空间金字塔池化层来解决CNN只是输入固定尺寸的问题，因为单固定尺寸的输入会影响识别效果，并且对于多尺度图像的情况下鲁棒性不好。SPP-net很好的解决了以上问题，对于任意尺度图像都可以提取出固定维度的特征，实验证明SPP-net对分类任务(不同网络结构)和目标探测任务都有积极的作用。RCNN则是将候选区送入模型，这样会非常耗时，而且SPP-net网络以整张...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。