Fast R-CNN

最新推荐文章于 2024-07-22 12:27:09 发布

听风吹等浪起

最新推荐文章于 2024-07-22 12:27:09 发布

阅读量923

点赞数 1

分类专栏： # 关于 object detection 文章标签： cnn 深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44886601/article/details/130055537

版权

关于 object detection 专栏收录该内容

12 篇文章 0 订阅

订阅专栏

目录

1. 关于 R-CNN 的缺点

3. Fast R-CNN 算法的流程

3.1 CNN 特征提取

3.2 ROI pooling

3.3 Fast R-CNN 的输出

3.4 损失函数

4. Fast R-CNN的不足

1. 关于 R-CNN 的缺点

RCNN算法流程如下

RCNN算法分为四个步骤：

SS 算法生成2000个候选框
将2000个候选框送入CNN特征提取网络，生成2000*4096个特征向量
将2000*4096特征送入SVM分类器进行训练分类
通过回归器对最后的候选框进行微调

从上述可以发现，RCNN的训练是多阶段的：CNN网络+SVM分类器+边界框回归器

这样的训练在时间和空间上都是昂贵的

时间上，例如CNN特征提取需要SS算法产生2000个候选框才能工作，无法并行化

空间上，例如SVM需要的输入是CNN产生的2000*4096的特征，需要保存这些，所以浪费磁盘内存

2. Fast R-CNN

Fast R-CNN 算法分为三个阶段：

首先，通过SS算法生成候选框。

然后，Fast R-CNN网络的输入是：整个图像+候选框。经过CNN网络提取特征，将候选框映射到CNN提取的特征上。

最后，将特征矩阵通过ROI pooling缩放成7*7大小的特征图，所以这里图像的输入是不需要固定大小的

Fast R-CNN 最后的输出有两个：分类的类别+边界框回归器

RCNN的分类SVM和回归器是单独训练的，而Fast R-CNN是一起训练的

3. Fast R-CNN 算法的流程

Fast R-CNN 算法流程，其中的SS候选框生成和RCNN一样，这里不再介绍

3.1 CNN 特征提取

Fast R-CNN 的特征提取CNN网络是将原图和候选框作为输入

CNN网络只需要在原图进行特征提取，然后通过候选框和原图的位置关系映射到CNN提取的特征上

R-CNN是将2000个候选框全部送入CNN网络，不仅复杂，且较多重复的图像被运算

3.2 ROI pooling

ROI Pooling是将CNN提取的特征划分为7*7大小的区域，每一个区域作最大池化下采样

这样输入图像的尺寸就不需要限制了

3.3 Fast R-CNN 的输出

Fast R-CNN 输出有两个：分类的类别+边界框回归器

如下是fc经过softmax的类别分类

如下为边界框回归器

3.4 损失函数

损失函数：分类损失+边界框回归器损失

其中，分类损失就是多分类任务的损失，采用交叉熵损失

边界框回归器损失：其中艾佛森括号u>=1 为1，否则为0

smooth是为了防止梯度消失或者梯度爆炸

当预测框与真实框差别过大时，梯度值不会太大（+1，-1）

当预测框与真实框差别过小时，梯度值足够小，有利于反向传播（x）

4. Fast R-CNN的不足

Fast R-CNN 分为两个阶段，虽然大幅度提升了速度，但是SS算法生成的候选框运算也很长(2s左右)，而后面的分类+特征提取的运行时间很短(0.1s的数量级)

所以SS算法成为了Fast R-CNN的短板

听风吹等浪起

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
Fast R-CNN

Fast R-CNN简单介绍
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

听风吹等浪起 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。