关于FPN的三个疑问

最新推荐文章于 2022-06-08 15:36:03 发布

JuyongJiang

最新推荐文章于 2022-06-08 15:36:03 发布

阅读量293

点赞数

分类专栏： Computer Vision 文章标签：计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40263477/article/details/105034136

版权

Computer Vision 专栏收录该内容

57 篇文章 10 订阅

订阅专栏

CVPR 现场提问

1、不同深度的 feature map 为什么可以经过 upsample 后直接相加？

A：作者解释说这个原因在于我们做了 end-to-end 的 training，因为不同层的参数不是固定的，不同层同时给监督做end-to-end training，所以相加训练出来的东西能够更有效地融合浅层和深层的信息。（通过训练参数，可以达到融合浅层和深层信息的目的）

在这里插入图片描述

2、为什么 FPN 相比去掉深层特征 upsample(bottom-up pyramid) 对于小物体检测提升明显？（RPN 步骤 AR 从 30.5 到 44.9，Fast RCNN 步骤 AP 从 24.9 到 33.9）

A：对于小物体，一方面它提高了小目标的分辨率信息；另一方面，如图中的挎包一样，从上到下传递过来的更全局的情景信息可以更准确判断挎包的存在及位置。（提高小目标检测精度，需要高分辨率和全局的情景信息，FPN使得二者兼得）

在这里插入图片描述

3、如果不考虑时间情况下，image pyramid 是否可能会比 feature pyramid 的性能更高？

A：作者觉得经过精细调整训练是可能的，但是 image pyramid 主要的问题在于时间和空间占用太大，而 feature pyramid可以在几乎不增加额外计算量情况下解决多尺度检测问题。（模型简单，速度快和空间小优先选择）

在这里插入图片描述

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
关于FPN的三个疑问

CVPR 现场提问1、不同深度的 feature map 为什么可以经过 upsample 后直接相加？A：作者解释说这个原因在于我们做了 end-to-end 的 training，因为不同层的参数不是固定的，不同层同时给监督做end-to-end training，所以相加训练出来的东西能够更有效地融合浅层和深层的信息。（通过训练参数，可以达到融合浅层和深层信息的目的）2、为什么 ...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。