ROI Pooling在Faster-RCNN中的应用理解

Faster-RCNN流程图:

在Faster-Rcnn中使用了ROI pooling,原本我以为只是一种升级版的warped,只是将图片进行缩放到一个合适的大小进行输入,后来发现还是具有很大的不同

假设原输入图像大小为800*800,经过CNN后输出feature map大小为50*50,其中原图中红色框对应为图像经CNN后再经过RPN网络输出的其中一个proposal ROI,在原图中表现为665*665,在feature map上的大小为41*41

Roi-Pooling的输入就是feature map和经过RPN后输出的proposal ROI

一个图中的物体可以输出许多proposal ROI,RoI pooling会将每一个输入的RoI以及feature map上对应RoI的区域 , 转化成一个固定维度的map,输出map的维度取决于设定的ROI pooling中的超参数,比如pooled_size,就是指ROI pooling之后的大小

假设pooled_size为7,就是将ROI区域变成7*7的block,每块block输出区域中最大的值,最终输出也是7*7的维度

例如下图中小的feature map为8*8

当ROI pooling中的pooled_size为2时,会在feature map上将proposal ROI(图中的黑色框)分成2*2共4个block,其中每个block中的输出取max pooling对应的输出就是

这只是其中一个proposal ROI对应的输出,而每个proposal ROI都会有对应的2*2的输出

并且并不是所有情况下能够被刚好分成n*n块block,会出现某些一个点被重复计算使用的情况,如

图中的十字部分就是被重复多次使用的部分

https://blog.csdn.net/weixin_44638957/article/details/97144418写的特别好

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Faster R-CNN和Mask R-CNN都是基于卷积神经网络(CNN)的目标检测方法。 Faster R-CNN是RPN(Region Proposal Network)和Fast R-CNN的结合,其RPN用于在特征图上生成候选框,然后通过Fast R-CNN进行具体的分类和回归。Mask R-CNN在Faster R-CNN的基础上增加了一个Mask Prediction Branch,用于预测目标的精确分割掩码。 Faster R-CNN的工作流程是先使用RPN生成候选框,然后通过ROI Pooling将每个候选框内的特征提取出来,最后使用分类器和回归器对提取的特征进行分类和位置修正。而Mask R-CNN在这个基础上引入了ROI Align操作,可以更精确地对候选框进行特征提取,然后通过Mask Prediction Branch生成每个目标的精确分割掩码。 要理解Faster R-CNN和Mask R-CNN,可以从R-CNN开始学习。R-CNN是目标检测领域的开山之作,它通过选择性搜索(Selective Search)算法提取候选框,并使用CNN对这些候选框进行分类和位置修正。Fast R-CNN是对R-CNN的改进,将选择性搜索替换为ROI Pooling操作,提高了检测速度和准确性。Faster R-CNN进一步将RPN引入Fast R-CNN,用于生成候选框,提高了检测的效率。 因此,可以说Faster R-CNN是RPN和Fast R-CNN的组合,而Mask R-CNN是在Faster R-CNN的基础上增加了一个Mask Prediction Branch和ROI Align操作,用于更精确地进行目标的分割。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [神经网络学习笔记7——目标检测,语义分割和实例分割RCNNFast RCNNFaster RCNN、FCN和Mask RCNN](https://blog.csdn.net/qq_45848817/article/details/127965649)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值