论文阅读006-RCNN-Rich feature hierarchies for accurate object detection and semantic segmentation

写在前面

阅读论文的时候有一些术语不理解,在这里汇总一下。
Region Proposal Algorithms:将图片分成很多很小的区域的方法
就Region Proposal Algorithms也有好几种。

  • Exhaustive Search 穷举法
    遍历图像的每一个像素
  • Segmentation 分割法
  • Selective Search
    ……

可以参考下面文献查看更多术语的详细解释:
https://zhuanlan.zhihu.com/p/23006190
https://zhuanlan.zhihu.com/p/39927488

本文重点

  • Region Proposal AlgorithmsCNN结合,故命名为RCNN。
  • 当有标注数据量比较少时,先进行有监督预训练(supervised pre-training),再进行无监督训练(unsupervised pretraining)

模型设计

步骤一:有监督预训练网络参数

使用AlexNet训练好的网络参数【即本文创新点supervised pretraining】✔️;

步骤二:模型fine-tuning

去掉AlexNet中最后的1000-way层,换成(20+1)-way层,因此只保留AlexNet中的主干网络卷积层部分,全连接层去掉;
注:20+1中的20代表物体类别数为20,1代表类别为背景

步骤三:特征提取

  • 提取候选框(使用selective search)

什么是selective search选择性搜索?

通过selective search方法可以有效节约时间和减少计算量。

  • 使用CNN网络提取候选框特征【本文创新点】✔️

步骤四:训练SVM分类器

  • 每类对应一个SVM分类器

步骤五:回归器精选候选框位置

  • 利用线性回归模型判定框的准确度

模型缺点

  • RCNN不是整体意义上的深度学习模型,只是将传统目标识别方法中的物体特征提取这一部分使用CNN模型
  • 模型训练时间还是较长
  • 步骤较多

官方源码

matlab+caffe
https://github.com/rbgirshick/rcnn

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值