目标检测4——Fast R-CNN（ROI Pooling、SVD、Multi-task Loss等新特性实现端到端的训练并显著提升训练和推理的速度）

知识复盘计划

已于 2024-01-13 20:06:10 修改

阅读量1k

点赞数 23

分类专栏：目标检测文章标签：目标检测 cnn 人工智能计算机视觉深度学习

于 2024-01-12 23:25:04 首次发布

本文链接：https://blog.csdn.net/qq_45792437/article/details/135563406

版权

7 篇文章 0 订阅

订阅专栏

二阶段目标检测系列文章
目标检测1——二阶段目标检测概述
 目标检测2——R-CNN（将CNN网络应用在目标检测领域的开山之作）
目标检测3——SPPNet（空间金字塔池化可以接收任何尺度的图像）
目标检测4——Fast R-CNN（ROI Pooling、SVD、Multi-task Loss等新特性实现端到端的训练并显著提升训练和推理的速度）
目标检测5——Faster R-CNN（RPN网络代替Selective Search来获取候选框）

一、基本介绍

ICCV-2015：Fast R-CNN
Fast R-CNN 是在 R-CNN 的基础上融入了 SPPNet 网络优点之后的一个改进网络
Fast R-CNN的优势：
- 实现了端到端的单阶段模型训练（R-CNN 需要分别训练CNN网络，多个 SVM分类器，BB回归器）
  - 所有层的参数都可以 fine-tune 重训练
  - 不需要离线存储特征文件
  - 使用 Softmax 替换 SVM 分类器
- 兼容任意尺寸图像（ROI Pooling）
- 采用奇异值分解 SVD 简化 FC 全连接层的计算量
- 多任务损失函数（Muti-task Loss）
- 训练/预测运行速度更快
- mAP评估指标更高
Fast R-CNN的主要问题：使用SS产生候选区域块ROI区域在整个检测过程中耗时太长（SS候选框获取2~3s，特征分类0.3s），这个问题会将后续的 Faster R-CNN 中解决
基于VGG16的Fast RCNN模型在训练速度上比R-CNN快大约9倍，比SPPnet快大约3倍；测试速度比R-CNN快大约213倍，比SPPnet快大约10倍，在VOC2012数据集上的mAP大约为66%

ROIS 是指 Selective Search 完成后得到的所有“候选框”在特征图上的映射
ROI（单层）就是对 SPP（三层）的简化
其思路如下：
- 将 Region Proposal 划分成 H×W 大小的网格
- 对每个网络做 Max Pooling
- 这样就形成固定大小为 H×W 的 Feature Map

SPP Pooling vs ROI Pooling

在这里插入图片描述

Muti-task Loss

Loss function of Fast R-CNN model

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

关注