G-CNN: an Iterative Grid Based Object Detector

G-CNN: an Iterative Grid Based Object Detector

Introduce

论文下载地址
G-CNN是CVPR16一篇关于目标检测的文章。从2016CVPR的文章可以看出目标检测的新的趋势,去除Region Proposals。之前CNN做目标检测的方法,主要是RCNN,SPPNet,Fast-RCNN,Faster-RCNN等,这些方法基本都沿袭下面的思路:

Created with Raphaël 2.1.0 region propasols CNN extract feature classify&bb regression

但是region proposals是一个费时的操作,在rpn网络之前大部分都是使用selective search或者类似的方法,从原始图片提取将近2K张图片,这个耗时的方法是目标检测过程的瓶颈。后来Faster-RCNN提出了rpn网络,用网络提取region proposal,这大大缩短了提取region proposal的时间。随着目标检测工作的进展,很多人开始思考这个问题?是否有必要提取region proposals,很多人做成了这种尝试,比如在cvpr16 RBG大神的YOLO,ECCV16Wei liu的SSD都是基于回归的方式,去除region proposal来做目标检测。
G-CNN是MaryLand大学的工作,论文主要的思路也是消除region proposal,和YOLO,SSD不同,G-CNN的工作借鉴了迭代的想法,把边框检测等价于找到初始边框到最终目标的一个路径。但是使用one-step regression不能处理这个非线性的过程,所以作者采用迭代的方法逐步接近最终的目标。

![图1](https://img-blog.csdn.net/20161209110217815?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvemlqaW4wODAyMDM0/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast) G-CNN的主要过程如figure1所示,首先对一副图片初始化一系列多尺度的grid,这些grid重叠存在。上图是为了让视觉明显而画的,事实上grid是重叠的。训练阶段,每一个box都会根据和ground truth box的IOU分配一个ground-true object。每一次迭代,box向分配的ground true object移动。测试过程,每次迭代均可根据类别的可信度,和具体位置,进行迭代更新。

G-CNN Object Detector

G-CNN的网络可以采用任何的网络结构,包括alexnet,googlenet,vggnet。网络的结构如下图所示:


图2

经过卷积层提取图像的特征,通过ROI pooling得到bounding box的特征,经过全连接层以后,使用softmax进行分类和bounding box regression,得到的结果进行下一次迭代。去除迭代过程,网络结构和Fast RCNN保持一致,但是两者的目标函数和过程都不相同。G-CNN把问题定位为在所有可能的bounding boxes中迭代搜索目标。Fast-RCNN则是通过selective search得到bounding boxes的可能集合。由于在边框搜索的过程是一个非线性的搜索过程,直接使用线性的搜索无法得到最优的结果,所以使用迭代的过程,每次移动一小步,逐步逼近最优解。

Loss function

G-CNN是一个迭代的过程,所以每次迭代都有存在一个loss function。假设 B 表示整个所有的bounding boxes(center, width, height)构成的集合。 BiB 是第i个training bounding box。下标 1sStrain 表示第s次的迭代。 Bsi 就是第s次迭代第i个bounding box。
在训练时候,首先把IOU阈值大于0.2的边框分配一个ground truth bounding box,表示该边框移动的目标。分配函数如下所示:

Λ(B2i)=arg
  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值