Fast RCNN论文总结

1. Region Proposal (候选区域)方法比传统的滑动窗口方法获取的质量要更高。
比较常用的Region Proposal方法有:SelectiveSearch(SS,选择性搜索)、Edge Boxes(EB)。

2. Fast RCNN 目标检测流程

第一步,将这个完整的图片经过若干卷积层与max pooling层,得到一个feature map。

第二步,用selective search算法从这完整的图片中提取出object proposals,即RoI。

第三步,根据映射关系,可以得到每个object proposal对应的feature map。

第四步,将第三步得到的feature map经过RoI pooling layer得到固定大小的feature map(变小了)。

第五步,经过2层全连接层(fc),得到固定大小的RoI特征向量。

第六步,特征向量经由各自的FC层,得到两个输出向量:第一个是分类,使用softmax,第二个是每一类的bounding box回归。


3. Fast RCNN 框架
4. Fast RCNN的优点
(1)比RCNN、SPPnet有更高的准确率(mAP)
(2)训练是单阶段的,使用多任务损失(multi-task loss)
(3)在训练阶段可以更新所有的网络层(SPPnet只能更新FC层,限制的mAP)
(4)对于特征缓存,不需要磁盘存储

5. RoI pooling layer
    作用:(1)将image中的rol定位到feature map中对应patch
                (2) 将这个feature map patch下采样为大小固定的feature再传入全连接层


6. multi-task loss

有两个损失: 分类loss(Lcls),是一个N+1路的softmax输出,其中的N是类别个数,1是背景;

                        回归loss(Lloc),是一个4xN路输出的regressor,也就是说对于每个类别都会训练一个单独的regressor。    

          

论文中=1, 用于调整2个损失之间的平衡;

当图片是背景时:k*=0  →  [k* ≥ 1]=0

当图片不是背景时:k*≥ 0  →  [k* ≥ 1]=1

这里regressor的loss不是L2的,而是一个平滑的L1(预防梯度爆炸),如下公式:

          
 7. 设计评估
(1)multi-task training 效果更好
(2)图像单一尺寸与多个尺寸效果相似
(3)更多的数据能够显著提升效果(论文中数据增强方法:50%概率进行水平翻转)
(4)不能盲目增加propsals数量,有可能导致mAP下降
(5)没有必要对所有的conv层进行finetune




Fast R-CNN是一种基于深度学习的目标检测算法,相比之前的R-CNN和SPP-Net,Fast R-CNN在检测精度和速度上都有明显的提升。以下是Fast R-CNN的实验讲解: 1. 实验数据集 在Fast R-CNN论文中使用了PASCAL VOC 2007、2010和ILSVRC 2013数据集进行实验。这些数据集是目标检测领域的标准数据集,包含多个类别的图像和对应的标注信息,可以用于训练和测试目标检测算法。 2. 实验结果 在PASCAL VOC 2007测试集上,Fast R-CNN使用VGG-16作为基础网络,检测精度(mAP)达到了66.9%。相比之前的R-CNN和SPP-Net,Fast R-CNN的检测精度提升了近10个百分点。 在ILSVRC 2013检测数据集上,Fast R-CNN使用ZF网络和VGG-16网络进行实验,检测精度分别为31.4%和34.9%,速度也明显快于之前的算法。 3. 实验分析 Fast R-CNN的检测精度和速度都有明显的提升,这主要得益于以下几点: - RoI池化层:Fast R-CNN引入了RoI池化层,可以将不同大小的RoI映射为固定大小的特征图,避免了之前算法中的重复计算和内存浪费。 - 多任务损失函数:Fast R-CNN将分类和回归任务合并为一个多任务损失函数,可以同时优化分类和位置回归两个任务,提高了检测精度。 - 共享卷积特征:Fast R-CNN使用共享的卷积特征,可以避免对每个RoI都进行卷积操作,节省了计算时间和内存。 总的来说,Fast R-CNN算法在目标检测领域取得了很好的效果,为后续的算法研究和应用奠定了基础。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

行者无疆兮

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值