Fast R-CNN

Fast R-CNN是目标检测领域的重要里程碑,它通过多任务损失函数将物体识别和位置修正整合在一个网络中,提升了训练效率。RoI pooling层替代SPP层,允许反向传播优化整个网络。网络从预训练模型初始化,采用SGD mini_batch分层采样方法进行微调,同时探讨了尺度不变性。训练和测试过程包括RoI特征提取、池化、分类和定位,以及NMS筛选最终结果。
摘要由CSDN通过智能技术生成

目录

 

一、概括

二、Fast R-cnn框架介绍

三、主要内容

3.1 RoI pooling layer

3.2 从预训练网络中初始化

3.3 微调网络用来检测

3.4 尺度不变性

四、训练过程/测试过程

4.1 训练过程

4.2 测试过程

参考资料


一、概括

在前面两篇帖子《R-CNN》《Spatial Pyramid Pooling》中,我们知道R-CNN和SPP在当时的目标检测领域绝对是被研究的热门,虽然也存在很多的不足,随着对网络结构的优化,和一些深度学习技巧的使用,于是Fast R-CNN就诞生,并迅速替代了前面的方法,相对于R-CNN与SPP-net,Fast R-cnn的主要亮点有:Fast R-CNN将借助多任务损失函数,将物体识别和位置修正合成到一个网络中,不再对网络进行分步训练,不需要大量内存来存储训练过程中特征的数据;用RoI层代替SPP层,可以使用BP算法更高效的训练更新整个网络。现在,这些方法已经很少使用了,但是经典的网络中涉及到的框架结构搭建,训练与优化等技巧还是值得我们去学习。

二、Fast R-cnn框架介绍

框架介绍:一张包含多个RoI(regions of interest)的图片(上图便于说明只显示一个RoI,灰色部分)输入一个多层的卷积网络中,获得Conv feature map,然后每一个RoI被池化成一个固定大小的feature map,feature map被全连接层拉伸成一个特征向量。对于每一个RoI,经过FC层后得到的feature vector最终被分享:一个进行全连接之后用来做softmax回归,用来对RoI区域做物体识别,另一个经过全连接之后用来做b-box regression做修正定位,使得定位框更加精准。

三、主要内容

3.1 RoI pooling layer

不同于前面的SPP,在Fast RCNN网络中,RoI来完成SPP层的作用。RoI指的是在一张图片上完成Selective Search后得到的“候选框”在特征图上的一个映射,RoI层的作用主要有两点:

  1. 考虑到感兴趣区域(RoI)尺寸不一,但是输入
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值