Fast RCNN学习

针对上一篇博客中RCNN算法的一些弊端,加快了训练和测试的算法复杂度。

第一:由于经过selective search算法提取了2000左右的图片,而这2000个图片均需要进行特征提取操作,

均需要经过CNN网络提取结构特征,而显然这些图像有大量的重叠区域,特征提取操作有很多冗余操作。

第二:RCNN中,在提取完特征后,还需要经过SVM分类器与Bounding-box回归这两步,fast RCNN

在网络的最后设计了两个并行的全连接网络来替代单独的SVM与Bounding-box窗口回归。

第三:fast RCNN为了减少计算量,使用了一些小trick,用SVD分解保留大参数来减少计算量。

————————————————————————————————————————————————

fastRCNN之前有一篇论文Spatial Pyramid Pooling in Deep ConvolutionalNetworks for Visual Recognition

论文地址:https://arxiv.org/pdf/1406.4729.pdf

论文算法为SPPnet,sppnet不同于RCNN最大的区别在于:

rcnn是在图像输入卷积之前就进行了selective search得到很多portals,然后这些portals分别输入到CNN中得到features

而sppnet则是在得到一个图片的CNN feature maps后再根据各portals在原图中的位置选择这些portal对应的feature。

sppnet另一个特点就是,不限制portal的大小,这里在得到不同大小的portal feature后,运用论文中提到的pyramid pooling

将这些不同大小的portal feature变成同一个长度。

注意:由于这里CNN网络的参数都是由如VGG、ImageNet等训练好的,所以在pyramid pooling及其之前的参数是不需要

梯度下降更新的,所以可以随便操作,不用担心在SGD过程中梯度没法计算的问题。


论文中非常关键的一点是:在由原图向feature map映射时,是直接根据像素点在图像中的相对关系映射的,

即原图中的一个portal的框,在feature map中对应的也是一个框。可以这么理解:对于一个训练好的CNN网络

(注意这里一定是训练好的,如果不训练好是没有这样的性质的),feature map相当于是一个区域滤波器一层一层的对

原图进行处理的(比如对原图进行高斯滤波处理),feature map相当于是原图的缩小版。

实际上,这里有一个博客,里面的图展示了各conv层得到的feature map与原图:

http://blog.csdn.net/mr_curry/article/details/53914502


不同于RCNN,fast rcnn在roi pooling后分成了两个并行的网络,其中一个为softmax分类网络,

另外一个为针对每一个类别的线性变换参数网络。在训练时,这两个网络的loss函数在乘以参数加起来

作为整个网络的loss函数。

————————————————————————————————————————————————

关于目标检测算法的一个知乎专栏:

https://zhuanlan.zhihu.com/xiaoleimlnote

————————————————————————————————————————————————

Fast RCNN的代码作者是用caffe框架写的,caffe框架在ubuntu下配置是个麻烦的过程。

笔记本没有N卡的,配置比较简单,参照一个博客进行安装:

http://www.linuxidc.com/Linux/2016-09/135025.htm

安装过程中的错误,可以参照这里解决:

https://blog.buer.website/2017/05/05/Caffe/

————————————————————————————————————————————————


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值