深度学习-【目标检测】学习笔记1.1Faster RCNN理论合集

最新推荐文章于 2024-05-07 15:14:04 发布

Wei *

最新推荐文章于 2024-05-07 15:14:04 发布

阅读量263

点赞数

分类专栏：计算机视觉文章标签：深度学习目标检测学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43406895/article/details/126979149

版权

计算机视觉专栏收录该内容

16 篇文章 0 订阅

订阅专栏

文章目录

一、RCNN
二、FastRCNN
三、FasterRCNN

一、RCNN

论文地址：https://arxiv.org/abs/1311.2524

R-CNN（Region with CNN feature）
在这里插入图片描述

4个步骤：
在这里插入图片描述

1.候选区域的生成

在这里插入图片描述
1k~2k个候选区域（使用Selective Search方法）

2.对每个候选区域，使用深度网络提取特征

在这里插入图片描述

3.特征送入每一类的SVM分类器，判定类别

在这里插入图片描述

非极大抑制
在这里插入图片描述

4.使用回归器精细修正候选框位置

在这里插入图片描述
4个值：中心点的xy坐标、w和h的缩放因子。

在这里插入图片描述

二、FastRCNN

论文地址：https://arxiv.org/abs/1504.08083

在这里插入图片描述

3个步骤：
在这里插入图片描述

ROI：Region of Interest，感兴趣区域。

在这里插入图片描述

正样本和负样本

在这里插入图片描述 ROI Pooling缩放到统一的尺寸（7×7）

这样就不用限制图像的尺寸。

分类器和边界框回归器

在这里插入图片描述
并联两个全连接层：一个用于目标概率预测（分类器），一个用于边界框预测（边界框回归器）。

Multi-task loss

在这里插入图片描述

分类损失

在这里插入图片描述

回顾：
见https://blog.csdn.net/qq_43406895/article/details/126361642

假设真实标签的one-hot编码是：[0,0,…1,…,0]
预测的softmax概率为[0.1,0.3,…,0.4,…,0.1]
那么Loss=-log(0.4)

边界框回归损失

在这里插入图片描述
x、y、w、h

回归损失函数1：L1 loss, L2 loss以及Smooth L1 Loss的对比

[u>=1]表示当u>=1时值为1，否则为0。

在这里插入图片描述
计算速度瓶颈在于 Selective Search 算法。

三、FasterRCNN

论文地址：https://arxiv.org/abs/1506.01497
在这里插入图片描述

回顾，Fast R-CNN

Faster R-CNN（RPN + Fast R-CNN）：3个步骤
在这里插入图片描述

RPN网络结构

在这里插入图片描述
cls layer 中的 2k scores 中的 2 分别对应前景和背景的概率。

intermediate layer的256-d对应ZF的256，如果使用VGG16的话会变成512-d。

在这里插入图片描述

在这里插入图片描述

回顾：感受野的计算方式
F（i）=（F（i+1）-1）×Stride+Ksize

在这里插入图片描述

正样本和负样本

在这里插入图片描述

损失

在这里插入图片描述
分类损失
2k。多类别的交叉熵损失。

k。二分类的交叉熵损失。
在这里插入图片描述
边界框回归损失

Fast R-CNN损失

在这里插入图片描述

Faster R-CNN训练

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
深度学习-【目标检测】学习笔记1.1Faster RCNN理论合集

intermediate layer的256-d对应ZF的256，如果使用VGG16的话会变成512-d。并联两个全连接层：一个用于目标概率预测（分类器），一个用于边界框预测（边界框回归器）。cls layer 中的 2k scores 中的 2 分别对应前景和背景的概率。预测的softmax概率为[0.1,0.3,…假设真实标签的one-hot编码是：[0,0,…[u>=1]表示当u>=1时值为1，否则为0。（RPN + Fast R-CNN）：3个步骤。4个值：中心点的xy坐标、w和h的缩放因子。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Wei * 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。