ROI Pooling在Faster-RCNN中的应用理解

最新推荐文章于 2023-04-19 15:02:39 发布

歌者And贰向箔

最新推荐文章于 2023-04-19 15:02:39 发布

阅读量956

点赞数 1

分类专栏：深度学习文章标签：机器学习计算机视觉人工智能算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ziqingnian/article/details/108835301

版权

深度学习专栏收录该内容

20 篇文章 8 订阅

订阅专栏

Faster-RCNN流程图：

在Faster-Rcnn中使用了ROI pooling，原本我以为只是一种升级版的warped，只是将图片进行缩放到一个合适的大小进行输入，后来发现还是具有很大的不同

假设原输入图像大小为800*800，经过CNN后输出feature map大小为50*50，其中原图中红色框对应为图像经CNN后再经过RPN网络输出的其中一个proposal ROI，在原图中表现为665*665,在feature map上的大小为41*41

Roi-Pooling的输入就是feature map和经过RPN后输出的proposal ROI

一个图中的物体可以输出许多proposal ROI，RoI pooling会将每一个输入的RoI以及feature map上对应RoI的区域 , 转化成一个固定维度的map，输出map的维度取决于设定的ROI pooling中的超参数，比如pooled_size，就是指ROI pooling之后的大小

假设pooled_size为7，就是将ROI区域变成7*7的block，每块block输出区域中最大的值，最终输出也是7*7的维度

例如下图中小的feature map为8*8

当ROI pooling中的pooled_size为2时，会在feature map上将proposal ROI（图中的黑色框）分成2*2共4个block，其中每个block中的输出取max pooling，对应的输出就是

这只是其中一个proposal ROI对应的输出，而每个proposal ROI都会有对应的2*2的输出

并且并不是所有情况下能够被刚好分成n*n块block，会出现某些一个点被重复计算使用的情况，如

图中的十字部分就是被重复多次使用的部分

https://blog.csdn.net/weixin_44638957/article/details/97144418写的特别好

歌者And贰向箔

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
ROI Pooling在Faster-RCNN中的应用理解

Faster-RCNN流程图：在Faster-Rcnn中使用了ROI pooling，原本我以为只是一种升级版的warped，只是将图片进行缩放到一个合适的大小进行输入，后来发现还是具有很大的不同假设原输入图像大小为800*800，经过CNN后输出feature map大小为50*50，其中原图中红色框对应为图像经CNN后再经过RPN网络输出的其中一个proposal ROI，在原图中表现为665*665,在feature map上的大小为41*41Roi-Pooling的输入就是fea
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。