Spp-Net 论文阅读

最新推荐文章于 2022-11-08 23:09:29 发布

JerrySing

最新推荐文章于 2022-11-08 23:09:29 发布

阅读量761

点赞数

分类专栏：论文阅读

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u010977034/article/details/82866526

版权

论文阅读专栏收录该内容

5 篇文章 0 订阅

订阅专栏

前面说RCNN的时候，说到了几个缺点：

1). 训练步骤繁琐：首先要用SS算法提取图片的候选区域，然后利用IOU计算每一块候选区域的标签，这是需要单独计算并将数据保存下来的。其次，利用候选区域与候选区域的标签训练CNN+SVM。最后利用BBox对边框回归。

2). 训练测试的速度均比较慢

3). 训练占用较大磁盘空间

4). 由于存在fc，所以需要对候选区域尺寸进行Resize，这样会导致图像扭曲变形，影响检测精度。

因此Spp-Net主要是针对第二点以及第四点进行改进。针对第二点：由于在RCNN中，训练和测试的时候，每个候选区域都会经过CNN特征提取网络，而候选区域之间是存在很大的重叠的，实际上有很多区域都计算了很多遍，所以导致训练和测试时的速度都很慢，因此作者提取直接对整图进行CNN提取，然后利用候选区域的位置坐标映射得到候选区域在特征图中的位置。针对第四点，作者提出了SPP层，用来对不同尺寸的特征归一化到相同尺度。

主要流程图如下所示：

spp的思想如下图所示，主要就是利用了金字塔的思想，将原始CNN中得到的特征图复制三份，第一份平均分割成4*4的网格，每个网格计算平均值输出，则会得到一个16维度的向量。第二份平均分成2*2的网格，计算网格平均值，得到4维向量，最后一份直接计算平均值，得到一维向量，将三个向量拼接起来，得到21维向量，且不管图像尺寸为多大，都能固定得到21维向量。其实这里存在一个问题，如果feature map除以4的时候除不尽，会导致定位精度的不准确，在mask rcnn中用align pool改进了。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

JerrySing CSDN认证博客专家 CSDN认证企业博客

码龄11年

14: 原创

18万+: 周排名

77万+: 总排名

17万+: 访问

: 等级

834: 积分

24: 粉丝

96: 获赞

21: 评论

632: 收藏

私信

关注

热门文章

分类专栏

最新评论

计算两幅图像的相似度总结
城城城_: pip install --upgrade scikit-image
计算两幅图像的相似度总结
城城城_: [code=python] from skimage.metrics import structural_similarity from scipy.misc import imread import numpy as np img1 = imread('0099.jpg') img2 = imread('0100.jpg') img2 = np.resize(img2, (img1.shape[0], img1.shape[1], img1.shape[2])) print(img2.shape) print(img1.shape) ssim = structural_similarity(img1, img2, multichannel=True) print(ssim) [/code]
计算两幅图像的相似度总结
ning_ww: 博主你好，请问基于直方图那种方法里，make_regalur_image是必须的嘛，不make_regalur有什么影响呢？
计算两幅图像的相似度总结
沐沐__: 博主你好，我对余弦相似度不太了解，但是需要应用一下，因此想问一下，如果将一张图像内的物体整体平移，对余弦相似度有什么影响
计算两幅图像的相似度总结
whalien: skimage版本太老了，升级一下库就行。新版中structural_similarity被废弃了

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。