深度学习-【目标检测】学习笔记1.1Faster RCNN理论合集

一、RCNN

论文地址:https://arxiv.org/abs/1311.2524

R-CNN(Region with CNN feature)
在这里插入图片描述

4个步骤:
在这里插入图片描述

1.候选区域的生成

在这里插入图片描述
1k~2k个候选区域(使用Selective Search方法)

2.对每个候选区域,使用深度网络提取特征

在这里插入图片描述

3.特征送入每一类的SVM分类器,判定类别

在这里插入图片描述
在这里插入图片描述

非极大抑制
在这里插入图片描述

4.使用回归器精细修正候选框位置

在这里插入图片描述
4个值:中心点的xy坐标、w和h的缩放因子。


在这里插入图片描述
在这里插入图片描述

二、FastRCNN

论文地址:https://arxiv.org/abs/1504.08083

在这里插入图片描述

3个步骤:
在这里插入图片描述

ROI:Region of Interest,感兴趣区域。

在这里插入图片描述
在这里插入图片描述
正样本和负样本


在这里插入图片描述ROI Pooling缩放到统一的尺寸(7×7)
在这里插入图片描述
这样就不用限制图像的尺寸。


分类器和边界框回归器

在这里插入图片描述
并联两个全连接层:一个用于目标概率预测(分类器),一个用于边界框预测(边界框回归器)。
在这里插入图片描述
在这里插入图片描述


Multi-task loss

在这里插入图片描述

分类损失

在这里插入图片描述

回顾:
https://blog.csdn.net/qq_43406895/article/details/126361642在这里插入图片描述

假设真实标签的one-hot编码是:[0,0,…1,…,0]
预测的softmax概率为[0.1,0.3,…,0.4,…,0.1]
那么Loss=-log(0.4)

边界框回归损失

在这里插入图片描述
x、y、w、h

回归损失函数1:L1 loss, L2 loss以及Smooth L1 Loss的对比

[u>=1]表示当u>=1时值为1,否则为0。


在这里插入图片描述
计算速度瓶颈在于 Selective Search 算法。

三、FasterRCNN

论文地址:https://arxiv.org/abs/1506.01497
在这里插入图片描述

回顾,Fast R-CNN
在这里插入图片描述


Faster R-CNN(RPN + Fast R-CNN):3个步骤
在这里插入图片描述

RPN网络结构

在这里插入图片描述
cls layer 中的 2k scores 中的 2 分别对应 前景和背景 的概率。

intermediate layer的256-d对应ZF的256,如果使用VGG16的话会变成512-d。

在这里插入图片描述

在这里插入图片描述

回顾:感受野的计算方式
F(i)=(F(i+1)-1)×Stride+Ksize
在这里插入图片描述

在这里插入图片描述

正样本和负样本

在这里插入图片描述

损失

在这里插入图片描述
分类损失
2k。多类别的交叉熵损失。
在这里插入图片描述

k。二分类的交叉熵损失。
在这里插入图片描述
边界框回归损失
在这里插入图片描述

Fast R-CNN损失

在这里插入图片描述


Faster R-CNN训练

在这里插入图片描述


在这里插入图片描述


在这里插入图片描述

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Wei *

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值