Fast R-CNN

最新推荐文章于 2024-07-22 12:27:09 发布

来一包板栗

最新推荐文章于 2024-07-22 12:27:09 发布

阅读量8.8k

点赞数 9

分类专栏：文献阅读文章标签： Fast R-CNN 目标检测

本文链接：https://blog.csdn.net/qq_27871973/article/details/81121995

版权

Fast R-CNN是目标检测领域的重要里程碑，它通过多任务损失函数将物体识别和位置修正整合在一个网络中，提升了训练效率。RoI pooling层替代SPP层，允许反向传播优化整个网络。网络从预训练模型初始化，采用SGD mini_batch分层采样方法进行微调，同时探讨了尺度不变性。训练和测试过程包括RoI特征提取、池化、分类和定位，以及NMS筛选最终结果。

摘要由CSDN通过智能技术生成

一、概括

二、Fast R-cnn框架介绍

三、主要内容

3.1 RoI pooling layer

一、概括

在前面两篇帖子《R-CNN》和《Spatial Pyramid Pooling》中，我们知道R-CNN和SPP在当时的目标检测领域绝对是被研究的热门，虽然也存在很多的不足，随着对网络结构的优化，和一些深度学习技巧的使用，于是Fast R-CNN就诞生，并迅速替代了前面的方法，相对于R-CNN与SPP-net，Fast R-cnn的主要亮点有：Fast R-CNN将借助多任务损失函数，将物体识别和位置修正合成到一个网络中，不再对网络进行分步训练，不需要大量内存来存储训练过程中特征的数据；用RoI层代替SPP层，可以使用BP算法更高效的训练更新整个网络。现在，这些方法已经很少使用了，但是经典的网络中涉及到的框架结构搭建，训练与优化等技巧还是值得我们去学习。

二、Fast R-cnn框架介绍

框架介绍：一张包含多个RoI（regions of interest）的图片（上图便于说明只显示一个RoI，灰色部分）输入一个多层的卷积网络中，获得Conv feature map，然后每一个RoI被池化成一个固定大小的feature map，feature map被全连接层拉伸成一个特征向量。对于每一个RoI，经过FC层后得到的feature vector最终被分享：一个进行全连接之后用来做softmax回归，用来对RoI区域做物体识别，另一个经过全连接之后用来做b-box regression做修正定位，使得定位框更加精准。