8月31日目标检测学习笔记——Faster RCNN

最新推荐文章于 2024-08-17 17:20:21 发布

Ashen_0nee

最新推荐文章于 2024-08-17 17:20:21 发布

阅读量258

点赞数

文章标签：目标检测学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Ashen_0nee/article/details/126616234

版权

文章目录

前言
一、Faster-RCNN
二、SPPNet（Spatial Pyramid Pooling）
三、Fast-RCNN
四、HyperNet
五、RFCN
六、Light-Head RCNN
七、Cascade RCNN

前言

本文为8月31日目标检测学习笔记，分为七个章节：

Faster-RCNN；
SPPNet（Spatial Pyramid Pooling）；
Fast-RCNN；
HyperNet；
RFCN；
Light-Head RCNN；
Cascade RCNN。

一、Faster-RCNN

1、原理

2、步骤

训练分类网络（AlexNet）；
Fine-tuning：
- 类别 1000 改为 20；
- 去掉 FC 层。
特征提取：
- 提取候选框；
训练 SVM 分类器，每个类别对应一个 SVM；
回归器精修候选框位置，利用线性回归模型判定框的准确度。

3、RoI Pooling

将 proposal 抠出来，然后 resize 到统一的大小：

根据输入的 image，将 RoI 映射到 featrue map 对应的位置；
将映射后的区域划分为相同大小的 sections；
对每个 section 进行 max pooling。

4、网络结构

主干网络：13con + 13relu + 4pooling；
RPN：3×3 + 背景前景区分 + 初步定位；
RoI Pooling；
分类+位置精确定位。

二、SPPNet（Spatial Pyramid Pooling）

空间金字塔池化：
- CNN 不同尺度输入；
- 仅对原图提取一次卷积特征。

三、Fast-RCNN

结合 SSPNet 改进 RCNN：

RoI Pooling：单层 SSPNet。

多任务网络同时解决分类和位置回归：

共享卷积特征。

四、HyperNet

Faster-RCNN 变种。

五、RFCN

VGG16 ⇒ ResNet；
通过 position sensitive score map 把目标的位置信息融合进 RoI pooling；
耗时的卷积尽量移到前面共享的 subnetwork 上。

六、Light-Head RCNN

Thinner feature map：score map 维度 ⇒ 10×p×p = 490；
将 k×k 的卷积转化为 1×k 和 k×1；
最后通过两个 fc 层实现分类和回归。

七、Cascade RCNN

只有 proposal 自身的阈值和训练器所用的阈值较为接近的时候，训练器的性能最好。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
8月31日目标检测学习笔记——Faster RCNN

本文为8月31日目标检测学习笔记，分为七个章节：- Faster-RCNN；- SPPNet（Spatial Pyramid Pooling）；- Fast-RCNN；- HyperNet；- RFCN；- Light-Head RCNN；- Cascade RCNN。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。