maskrcnn用于目标检测_【目标检测简史】Mask-RCNN

导读

Mask-RCNN 是ICCV2017 best paper, 是FAIR团队的Kaiming大神和RBG大神的强强联手之作。

Mask R-CNN= Faster R-CNN + FCN

通过在 Faster-RCNN 的基础上添加一个分支网络,在实现目标检测的同时,把目标实例分割。什么是 Instance segmentation,就是将一幅图像中所有物体框出来,并将物体进行像素级别的分割提取。

基于平台:Caffe2 (非官方有tensorflow,MXNet....)

摘要

我们提出了一种概念简单灵活通用的目标实例分割框架。我们的实现高效地检测图中的物体,并同时生成一张高质量的每个个体的分割掩码。这个方法叫做Mask R-CNN,在Faster R-CNN的基础志昂增加分支目标掩码预测网络,并行于当前的边界框识别。Mask R-CNN训练简单,对Faster R-CNN增加很小的额外支出,可以跑到5 FPS。此外,Mask R-CNN易于完成其他任务,比如同一框架下的人体姿态估计。我们展示了COCO数据集挑战的全三项的顶级结果,包括实例分割,物体检测,人体关键点检测。不需要技巧,Mask R-CNN在每一项上超越所有现存的单一模型的表现,包括COCO 2016的胜者。希望我们简洁高效的实现可以作为起点帮助简化未来的实例级别的识别。代码facebookresearch/Detectron。

技术要点

Mask R-CNN在概念上是很简单:对于每一个候选区域 Faster R-CNN 有两个输出,一个类别标签,一个矩形框坐标信息。这里我们加了第三个分支用于输出 object mask即分割出物体:目标掩码。目标掩码与已有的class和box输出的不同在于它需要对目标的空间布局有一个更精细的提取。接下来,我们详细介绍Mask R-CNN的主要元素,包括Fast/Faster R-CNN缺失的像素对齐(pixel-to pixel alignment)。

Faster R-CNN

这里简要回顾一下 Faster R-CNN,它有两个步骤组成,Region Proposal Network (RPN) 用于提取候区域,第二个步骤本质上和Fast R-CNN一样,使用 RoIPool 对候选区域提取特征进行类别分类和坐标回归。用于两个步骤的特征是可以共享的,这样可以提高速度。

Mask R-CNN:

Mask R-CNN 也是采用了两个步骤,第一个步骤就是 RPN 提取候选区域,在第二个步骤࿰

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值