深度学习之路（三）：SPP-Net

最新推荐文章于 2024-02-21 16:20:00 发布

木子一一

最新推荐文章于 2024-02-21 16:20:00 发布

阅读量351

点赞数

文章标签：机器学习深度学习 caffe

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_33439794/article/details/104479938

版权

本文深入探讨了R-CNN的局限性，尤其是图像归一化导致的精度损失和速度缓慢问题。接着介绍了何凯明的SPP-Net（空间金字塔池化网络），它通过空间金字塔池化层解决了固定大小输入的问题，显著提升了目标检测的速度，但尚未实现端到端的检测。SPP-Net的关键在于最后一层卷积后接的空间金字塔池化层，允许任意大小图像输入，提高了检测效率。

摘要由CSDN通过智能技术生成

上回书详细的介绍了R-CNN的前世今生，在文章的最后同样抛出了R-CNN中的不足点：其一是检测的精度相对而言比较低，这主要是图像归一化时对图像过度拉伸造成的，其二是检测速度慢，这个是由于每张图像需要分割成2000多个特征区域，然后依次进入卷积网络造成的。

发现问题下一步就是要解决问题。

首先我们来说一下为什么要进行图像的归一化。

这样做的目的是因为R-CNN采用的是Alexnet网络，而需要特别注意的是Alexnet网络的输入图像大小是固定大小的。即227*227像素。但是呢，通过SS算法产生的候选区域的大小是随机的，也就是说，等待进入神经网络进行特征提取的候选区域大小是不一样的，有的大有的小，这样的话，我们就给他归一化大小呗，统一归一化成227*227的了。

某国的整形文化十分厉害，但是长相不同的人都整成“网红脸”后，必然不是太自然。即使再高超的整形医师，再精湛的“刀工”也是会留下痕迹的，更何况是简单的拉扯，将大的小的长的方的图像强行归一化成227*227呢？

那么可不可以通过网络结构的整改，使得任意大小的图像都可以输入到卷积神经网络之中呢？当然可以了！！！下面祭出大神何凯明！

如果你想在目标检测领域有所斩获，那么以后你会经常读到它的论文！

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
深度学习之路（三）：SPP-Net

上回书详细的介绍了R-CNN的前世今生，在文章的最后同样抛出了R-CNN中的不足点：其一是检测的精度相对而言比较低，这主要是图像归一化时对图像过度拉伸造成的，其二是检测速度慢，这个是由于每张图像需要分割成2000多个特征区域，然后依次进入卷积网络造成的。发现问题下一步就是要解决问题。首先我们来说一下为什么要进行图像的归一化。这样做的目的是因为R-CNN采用的是Alexnet网络，而需要...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。