SPP，PPM、ASPP、FPN

秋水墨色

于 2021-08-25 14:59:59 发布

阅读量2.9k

点赞数

分类专栏：计算机视觉（OCR+目标检测+目标跟踪）+（优化+部署）文章标签：网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sdw5723118/article/details/119910776

版权

计算机视觉（OCR+目标检测+目标跟踪）+（优化+部署）专栏收录该内容

42 篇文章 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

本文介绍了深度学习中解决输入尺寸问题的四种技术：SPP允许固定输出尺寸，ASPP利用空洞卷积扩大感受野，PPM在语义分割中融合全局信息，而FPN在目标检测中结合不同层级的特征。这些技术提升了模型对不同尺度输入的处理能力。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

SPP(spatial pyramid pooling)

在spp出来之前，所有神经网络都是要输入固定尺寸的图片，比如经常遇到的224×224，图片输入网络前都要resize到224×224，导致图片变形，其中的信息也变形了，从而限制了识别精度。而SPP和ASPP就是为了解决这个问题，它可以让网络输入原图而不必resize。空间池化层实际就是一种自适应的层，这样无论你的输入是什么尺寸，输出都是固定的（21xchannel）

SPP的显著特点是：

不管输入尺寸大小，SPP 可以产生固定尺寸的输出
使用多个不同大小的pooling窗口
SPP 可以使用同一图像不同尺寸(scale)作为输入, 得到同样长度的池化特征。

ROI Pooling是针对RoIs的Pooling，其特点是输入特征图尺寸不固定，但是输出特征图尺寸固定。ROI Pooling的思想来自于SPPNet中的Spatial Pyramid Pooling，在

了解本专栏

超级会员免费看

博客等级

码龄16年

87
原创

26
点赞

191
收藏

286
粉丝

关注

私信

热门文章

分类专栏

最新评论

colmap源码解析
201309241627: 大家不好花钱订阅这篇文章里面的内容全部是官网复制粘贴出来的。完全并没有源码解析的内容。作者还删我之前的评论。
目标检测场景SSD-Mobilenetv1-FPN
fffffffaaaaannnn: 请问楼主有ssd_mobilenet_v1_fpn 实现的代码嘛
持续学习(continual learning/ life-long learning)
蜡笔新小: 博主你好，自己刚接触学习方法这一块，想要问一下博主，持续学习和元学习的最大区别在哪呢？是他们所放的重点不同么？我理解持续学习是防止灾难性遗忘，元学习是在新的任务上work
Sim3相似变换
公子￥小白: 请问下，sim3变换的3组点，能是同一坐标系下的3组点吗？
目标检测场景SSD-Mobilenetv1-FPN
lettog: 请问楼主有ssd_mobilenet_v1_fpn 实现的代码嘛

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

秋水墨色 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。