Cascade network——multi-stage refinement

List

  • Cascade R-CNN
  • Combine Cascade R-CNN and Mask R-CNN——Cascade Mask R-CNN
  • Hybrid Task Cascade for Instance Segmentation

Preview

目前,目前实例分割可以分成两个大类:(1)基于检测;(2)基于分割

  • 基于检测:产生bounding box或者是region proposal,并利用这些bounding box来预测mask,如DeepMask, SharpMask, Instance-FCN,近段时间,就有继承了Instance-FCN的FCIS,以及Mask R-CNN,PANet, MaskLab。
  • 基于分割:首先是获取像素级分割map,再去识别具体的个体目标。这方面工作目前还有许多跟传统方法相结合的地方,似乎没有基于检测的流行。

现在对于目标检测,有比较主流的分法是one-stage和two-stage,但是现在有一个分支就是multi-stage for finetune,这里之所以说是fintune,是因为这里multi-stage说的是级联的结构,一般是在头部进行几次级联结构,而且是为了对上一步的检测结果进行更加精炼的修正。

Multi-stage Object Detection
目标检测最开始应该是2016年开始的,摘抄自论文Hybrid Task Cascade for Instance segmentation],但实际上级联进行迭代修正的做法很早就出现,早在2010年的关于人脸的一些算法就有出现,应该还有更早的:

AttractioNet(2016)

网络的核心组件是基于CNN的category-agnostic目标位置修正模块,用来产生精确稳定的bounding box,还有一点,就是这个方法还可以对unseen categories(应该指的是数据集未指定的类别)进行定位。在当时,在coco2014以及VOC2007达到SOTA。以下是论文中算法的代码部分,由其中的反复迭代进行Attend & Refine来看,已经有了级联的意思了。
需要注意的几点:

  • 以下的ObjectnessScoring是对框与预标定的目标的贴近程度来打分,而非类别信息。(可以对比IoUNet)
  • seed boxes是需要通过算法选出来的,但不是使用滑动窗口,这里有提到选seed boxes的方法类似于Cracking Bing(这里不做重点关注),目的是尽量少的初始框却要将所有区域进行有效的覆盖。
    在这里插入图片描述
    上图似乎有些步骤没表达出来:
    在这里插入图片描述

CRAFT:CRAFT Objects from Images(2016)

code

这个时候R-CNN系列都已经出来了,论文里有引用。再说一下论文题目的含义:Cascade Region proposal-network And FasT-rcnn,即级联的RPN和fast R-CNN,也就是开始说的在RPN和head部分进行级联操作。数据集是PASCAL VOC 07/12 and ILSVRC
在这里插入图片描述
这是论文里给出一个对比图。

  • RPN:论文之所以要在RPN使用级联结构,是因为单独做了RPN处的实验,结论就是如果是有比较极端的scale, ratio的目标,或者是those usually immersed in object clutters, are also difficult to be distinguished from background, 如植物
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值