8月31日目标检测学习笔记——Faster RCNN


前言

本文为8月31日目标检测学习笔记,分为七个章节:

  • Faster-RCNN;
  • SPPNet(Spatial Pyramid Pooling);
  • Fast-RCNN;
  • HyperNet;
  • RFCN;
  • Light-Head RCNN;
  • Cascade RCNN。

一、Faster-RCNN

1、原理

1

2、步骤

  1. 训练分类网络(AlexNet);

  2. Fine-tuning:

    • 类别 1000 改为 20;
    • 去掉 FC 层。
  3. 特征提取:

    • 提取候选框;
  4. 训练 SVM 分类器,每个类别对应一个 SVM;

  5. 回归器精修候选框位置,利用线性回归模型判定框的准确度。

3、RoI Pooling

将 proposal 抠出来,然后 resize 到统一的大小:

  1. 根据输入的 image,将 RoI 映射到 featrue map 对应的位置;
  2. 将映射后的区域划分为相同大小的 sections;
  3. 对每个 section 进行 max pooling。

4、网络结构

2

  • 主干网络:13con + 13relu + 4pooling;
  • RPN:3×3 + 背景前景区分 + 初步定位;
  • RoI Pooling;
  • 分类+位置精确定位。

二、SPPNet(Spatial Pyramid Pooling)

3

  • 空间金字塔池化:
    • CNN 不同尺度输入;
    • 仅对原图提取一次卷积特征。

三、Fast-RCNN

结合 SSPNet 改进 RCNN:

  • RoI Pooling:单层 SSPNet。

多任务网络同时解决分类和位置回归:

  • 共享卷积特征。

3


四、HyperNet

Faster-RCNN 变种。

4


五、RFCN

5

  • VGG16 ⇒ ResNet;
  • 通过 position sensitive score map 把目标的位置信息融合进 RoI pooling;
  • 耗时的卷积尽量移到前面共享的 subnetwork 上。

六、Light-Head RCNN

6

  • Thinner feature map:score map 维度 ⇒ 10×p×p = 490;
  • 将 k×k 的卷积 转化为 1×k 和 k×1;
  • 最后通过两个 fc 层实现分类和回归。

七、Cascade RCNN

7
只有 proposal 自身的阈值和训练器所用的阈值较为接近的时候,训练器的性能最好。


  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值