候选区域(Region proposals )

来源:Coursera吴恩达深度学习课程

在阅读目标检测的文献时,我们可能会看到候选区域(region proposals),这在计算机视觉领域是非常有影响力的概念。

回忆一下之前的滑动窗法,需要对所有窗口进行检测器,这个算法的其中缺点是,它在显然没有任何对象的区域浪费时间

论文:[Girshick R, Donahue J, Darrell T, et al. Rich feature hierarchies for accurate object detection and semantic segmentation[C]

所以Ross Girshick,Jeff Donahue,Trevor Darrell,Jitendra Malik,在本幻灯片底部引用到的论文中提出一种叫做R-CNN的算法,意思是带区域的卷积网络(regions with convolutional network),或者说带区域的CNN。这个算法尝试选出一些区域,在这些区域上运行卷积网络分类器是有意义的,所以这里不再针对每个滑动窗运行检测算法,而是只选择一些窗口,在少数窗口上运行卷积网络分类器

如上图,选出候选区域的方法是运行图像分割算法(segmentation algorithm),分割的结果是右边的图像,为了找出可能存在对象的区域。比如说,分割算法在这里得到一个色块(blob),所以你可能会选择这样的边界框(编号1),然后在这个色块上运行分类器,就像这个绿色的东西(编号2),在这里找到一个色块,接下来我们还会在那个矩形上(编号2)运行一次分类器,看看有没有东西。在这种情况下,如果在蓝色色块上(编号3)运行分类器,希望你能检测出一个行人,如果你在青色色块(编号4)上运行算法,也许你可以发现一辆车。

所以这个细节就是所谓的分割算法,先找出可能2000多个色块,然后在这2000个色块上放置边界框并运行分类器,这样需要处理的位置可能要少的多,可以减少卷积网络分类器运行时间,比在图像所有位置运行一遍分类器要快。特别是这种情况,现在不仅是在方形区域(编号5)中运行卷积网络,也会会在高高瘦瘦(编号6)的区域运行,尝试检测出行人,然后在很宽很胖的区域(编号7)运行,尝试检测出车辆,同时在各种尺度运行分类器。

这就是R-CNN的特色概念,现在看来R-CNN算法还是很慢的。所以有一系列的研究工作去改进这个算法,基本的R-CNN算法是使用某种算法求出候选区域,然后对每个候选区域运行一下分类器,每个区域会输出一个标签,有没有车子?有没有行人?有没有摩托车?并输出一个边界框,这样你就能在确实存在对象的区域得到一个精确的边界框。

澄清一下,R-CNN算法不会直接信任输入的边界框,它也会输出一个边界框b_x,b_y,b_h和b_w,这样得到的边界框比较精确,比单纯使用图像分割算法给出的色块边界要好,所以它可以得到相当精确的边界框。

现在R-CNN算法的一个缺点是太慢了,所以这些年来有一些对R-CNN算法的改进工作。(上图第二行)Ross Girshik提出了Fast R-CNN算法,它基本上是R-CNN算法,不过用卷积实现了滑动窗法。最初的算法是逐一对区域分类的,所以Fast R-CNN用的是滑动窗法的一个卷积实现,这和滑动窗口的卷积实现(Convolutional implementation of sliding windows)中看到的大致相似,这显著提升了R-CNN的速度。

事实证明,Fast R-CNN算法的其中一个问题是得到候选区域的聚类步骤仍然非常缓慢,所以另一个研究组,任少卿(Shaoqing Ren)、何凯明(Kaiming He)、Ross Girshick和孙剑(Jiangxi Sun)提出了更快的R-CNN算法(Faster R-CNN),使用的是卷积神经网络,而不是更传统的分割算法来获得候选区域色块,结果比Fast R-CNN算法快得多。不过Andrew认为大多数Faster R-CNN的算法实现还是比YOLO算法慢很多。

总之,候选区域的概念在计算机视觉领域的影响力相当大。但是这是Andrew的个人看法而不是整个计算机视觉研究界的看法,Andrew觉得候选区域是一个有趣的想法。

说明:记录学习笔记,如果错误欢迎指正!转载请联系我。

  • 2
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值