深度学习之物体检测——Fast R-CNN(Ross Girshick)

Fast R-CNN是Ross Girshick对R-CNN的优化,通过一次卷积获取特征映射,然后将box投影并使用RoI Max Pooling层固定大小,提高检测效率。RoI Max Pooling层解决了box大小不一的问题,并在Caffe和PyTorch中得到实现。损失函数采用了Smooth L1Loss。
摘要由CSDN通过智能技术生成

Fast R-CNN是Ross Girshick对R-CNN进行改进的一篇文章,影响力也比较大。R-CNN的基本思想是用box proposal的特征映射作为其特征向量,然后进行分类与box精调。但是R-CNN需要对每个box proposal进行卷积操作得到box特征映射,这样大大降低了检测效率。Fast R-CNN在R-CNN基本思想不变的情况下,只对原图做一次卷次操作得打特征映射,然后把每个box投影到这个特征映射上去,得到box的特征映射。
本文会交替地使用“box proposal”和“RoI”(region of interest)。

网络

RoI投影到特征映射上

首先计算卷积网络的输入图像 H1W1 和特征映射 H2W2 的比

spatial_scal
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值