Fast R-CNN

最新推荐文章于 2024-07-22 12:27:09 发布

圆圆栗子君

最新推荐文章于 2024-07-22 12:27:09 发布

阅读量1k

点赞数 14

分类专栏：目标检测文章标签： cnn 人工智能神经网络深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_51700479/article/details/135678498

版权

目标检测专栏收录该内容

9 篇文章 0 订阅

订阅专栏

1 Fast R-CNN的改进

Fast R-CNN是在R-CNN的基础上融入了SPP Net网络优点之后的一个改进网络，相比于R-CNN和SPP Net具有以下优点：

1 训练/预测运行速度更快；

2 mAP效果评估指标更高；

3 实现端到端( end-to-end )的 单阶段 模型训练；（多任务损失函数(Multi-task loss)）

4 所有层的参数都可以fine tune重训练；

5 不需要离线存储特征文件；

6 采用SVD简化FC全连接层的计算量；

7 使用Softmax替换SVM分类器；

2 Fast R-CNN引进的技术

Fast R-CNN引入三种新技术：

RoI Pooling Layer

Multi-task loss (多任务损失函数)

SVD (类似连续的FC层<没有激活>)

2.1 ROI Pooling Layer

空间金字塔结构SPP的单层特例；

将ROI区域卷积高阶特征转换为HxW的结构；

内部使用Max Pooling。

就是将SPP三层融合在一起，变成了只有一层，如下图

这个改动我的理解来看，变成单层，留池化最多的一层，是因为，另外两层的特征在池化最多的一层里面其实也有部分体现，留一层减少了计算量等费时操作，效果的话相比较而言 ROI Pooling可能效果差一些，不过也还行，算是在在费时方面做了优化

2.2 Multi-task loss(多任务损失函数)

Multi-task loss：包含分类分支和回归分支，其中分类返回输出的是K+1个概率分布p，回归分支输出的是预测位置(box offset偏移系数值)。

前面是分类器损失，后面是回归器损失

指示函数

当u=0的时候(当前候选框为背景/负例)，函数值为0；

当u>=1的时候(当前候选框为物体/正例)，函数值为1；

在回归器用指示函数是因为在候选框为背景的时候，不需要用回归器，所以不计算回归损失

分类器损失就是计算每个类别的置信度的损失

回归器 Smooth L1 Loss损失函数

在RCNN中回归器使用的 L2Loss（平方误差损失）

相比较于RCNN为什么采用Smooth L1 Loss损失函数呢？

Smooth L1 Loss相比于L2 Loss，对于 离群点 更 不敏感 ，当预测值和实际值差值比较大的时候，使用L2 Loss容易出现梯度爆炸的问题，而使用Smooth L1Loss不容易出现梯度爆炸。

Smooth L1 Loss相比于L1 Loss，在预测值接近实际值的位置(x=0位置)，是连续可导的，收敛速度会更快。

Smooth L1 Loss的功能类似Huber Loss。

函数如下图

2.3 SVD(类似连续的FC层<没有激活>)

在R-CNN和SPP Net中，SS提取的ROI区域比较多，所以后面的全连接操作比较多，差不多得进行2K次全连接操作，因此计算量有点大，故Fast R-CNN中采用SVD分解加速全连接计算。在实现上，相当于将一个全连接拆分为两个全连接。

使用SVD之后的效果如下图

3 Fast R-CNN fine tune训练操作

在pre train的基础模型(前面的Conv特征提取使用ImageNet数据集上训练好的AlexNet或者VGG网络)上进行fine tune训练操作（微调，为了适应新的数据）

3.1 Mini-Batch Sampling抽样

分级抽样法(Hierarchical Sampling)

每个Batch抽取N个图像，然后从N个图像中抽取R个ROI区域组成训练数据

论文建议：Batch尺寸(128) = 每个Batch的图像数目(2) * 每个图像的ROI区域数目(64)

论文建议：每个Batch中，至少25%的正例样本。

充分利用卷积层的共享计算。

就是说每个批次选择两个图像，从两个图象里抽出来64个区域提名，一共128个样本进行批次训练

RoI分类基于和Ground Truth的重叠

物体/正例：IoU >= 0.5

背景/负例：IoU < 0.5

3.2 使用Softmax替换SVM分类器

为什么使用Softmax替换SVM分类器？

因为在R-CNN中，微调操作是一个独立的分类损失函数，模型的求解是一个独立的过程，所以求解的模型容易过拟合，故需要单独训练一个SVM分类器来进行明确的分类操作。而在Fast R-CNN中，由于损失函数是由两部分构成的：分类损失和回归损失；这相当于在softmax中引入了类间竞争，效果会更好，另外论文中测试效果如下：

4 Fast R-CNN的改进和缺陷

1 改进

基本解决了R-CNN的绝大多数问题，但是还是有一些问题没有解决，具体如下：

解决了SPP Net网络中的fine tune的问题(局部训练)；

解决了R-CNN网络中各阶段独立模型训练的问题(特征提取、SVM分类器、BBR回归器)；

使用Full Image的方式一次性提取图像的Feature Map，降低了提取RoI区域特征属性的运行时间；

引入RoI Pooling Layer层，对于不同大小的RoI候选框产生相同维度大小的特征属性向量。

2 缺陷

Fast R-CNN中的主要问题就是使用SS产生候选区域块ROI区域在整个检测过程中耗 时太长(SS候选框获取2~3s，特征分类0.3s)。

圆圆栗子君

关注

14
点赞
踩
28

收藏

觉得还不错? 一键收藏
1
评论
Fast R-CNN

Fast R-CNN是在R-CNN的基础上融入了SPP Net网络优点之后的一个改进网络，相比于R-CNN和SPP Net具有以下优点：1 训练/预测运行速度更快；2 mAP效果评估指标更高；3 实现端到端()的模型训练；（多任务损失函数(Multi-task loss)）4 所有层的参数都可以fine tune重训练；5 不需要离线存储特征文件；7 使用Softmax替换SVM分类器；
复制链接

扫一扫

专栏目录

圆圆栗子君 CSDN认证博客专家 CSDN认证企业博客

码龄4年

27: 原创

111万+: 周排名

15万+: 总排名

2万+: 访问

: 等级

700: 积分

333: 粉丝

422: 获赞

22: 评论

453: 收藏

私信

关注

热门文章

分类专栏

最新评论

强化学习基础（一）
CSDN-Ada助手: 恭喜你写了第20篇博客，标题为“强化学习基础（一）”！你的坚持和努力让我非常钦佩，同时也让我从你的博客中学到了很多知识。希望你能继续保持创作的热情和动力，同时也希望你可以在下一篇博客中深入探讨强化学习的进阶知识，让我们一起学习进步。期待你更多的精彩内容，加油！
CNN卷积理解
m0_68949064: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性，感谢博主的分享，文章思路清晰，图文并茂，详略得当，三连支持，期待博主持续输出好文。
输入数据预处理（去均值，标准化，归一化）
CSDN-Ada助手: 恭喜您写了第14篇博客！标题“输入数据预处理（去均值，标准化，归一化）”非常吸引人，内容也十分实用。您对数据预处理的讲解非常清晰，让我受益匪浅。在下一篇博客中，或许您可以探讨一下不同预处理方法在各种数据集上的效果对比，以及如何根据具体情况选择最适合的预处理技术。此外，如果能分享一些实际应用中的案例，将更加丰富和实践化您的博客内容。再次感谢您的分享，期待您未来更多精彩的创作！
CNN卷积理解
CSDN-Ada助手: 非常恭喜您完成了第15篇博客！标题“CNN卷积理解”非常吸引人，我可以感受到您对于这个主题的深入研究和理解。您对于卷积神经网络的解释和应用的阐述让我受益匪浅。在阅读您的博客后，我想提供一些建议，希望对您的下一步创作有所帮助。首先，您可以考虑引入更多的具体例子和实际应用，这样读者更容易理解和验证您的观点。其次，您可以尝试探索一些卷积神经网络的改进方法或者前沿研究，这将使您的博客更具吸引力和独特性。再次恭喜您的连续创作，期待您在未来的博客中继续分享您的见解和经验！
几种激活函数详解
CSDN-Ada助手: 恭喜您撰写了第16篇博客，题为“几种激活函数详解”。这是一个非常有价值的主题，并且您在文章中详细解释了各种激活函数的特点和用途。我真的很欣赏您对这个主题的深入研究。接下来，我希望能看到您在下一篇博客中进一步探讨激活函数的应用场景和实际案例。这样的话，读者们将更能从您的经验中受益并将知识应用到实际问题中。在您的文章中，您可以分享一些您自己使用激活函数解决问题的经历，这将使您的博客更加生动和引人入胜。再次恭喜您，期待您未来更多精彩的创作！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。