【深度学习】 三大经典识别算法 R-CNN、Fast R-CNN、Faster R-CNN概述简介

本文介绍了深度学习中的三个经典目标检测算法:R-CNN、Fast R-CNN和Faster R-CNN。R-CNN使用selective search获取候选框,通过卷积和svm分类;SPP-Net解决了尺寸问题。Fast R-CNN通过共享卷积提升效率,使用RoI Pooling。Faster R-CNN引入RPN层直接在特征图上生成候选框,进一步提高了速度。
摘要由CSDN通过智能技术生成

1.R-CNN (14年)

  1.首先用selective search的方法选出许多候选框;

  2.对于每一个候选框分别执行卷积网络的操作,提取特征;

  3.把卷积做好的特征放到svm分类器和Bbox reg的回归器。

  缺点:

  1.候选框没有共享卷积神经网络,不同的框要构造不同的神经网络(因为卷积层虽然不要求图片大小,但是全连接层有要求)。

  2.分类用svm做,很麻烦。

  3.特别费时,一次训练需要84小时,检测一张图片要84秒。

  改进,改进后名字叫SPP-Net:

     加了一个特殊的pooling层SPP层,连在全连接层前面。

  原理:把任意大小的图片进行一个pooling,pooling成一个串,把当前不同尺寸大小的图片,经过Pooling后拼接在一起连成的串的大小一致。然后就可以执行全连接操作,这样不用不同的框构造不同的神经网络,因为全连接层大小也一致了。

 

2.fast R-CNN(15年)

  • 0
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值