MaskLab: Instance Segmentation by Refining Object Detection with Semantic and Direction Features阅读笔记

MaskLab模型旨在解决实例分割问题,通过Faster-RCNN基础上的语义分割和方向预测,实现了更精确的对象检测与分割。论文指出现有模型的背景编码冗余和复杂方向解码问题,并提出改进方案。MaskLab采用语义和方向特征进行前景/背景分割,使用空洞卷积和超列特征进行精细化分割,以及变形剪裁提高定位精度。实验结果显示,MaskLab在COCO实例分割基准上表现出色。
摘要由CSDN通过智能技术生成

论文链接:https://arxiv.org/abs/1712.04837

论文研究:

论文解决了实例分割的问题,即同时解决对象检测和语义分割的任务。论文提出了一个名为MaskLab的模型,它可以产生三个输出:box检测,语义分割和方向预测。建立在Faster-RCNN对象检测器之上,预测的框提供了对象实例的准确定位。在每个感兴趣区域内,MaskLab通过组合语义和方向预测来执行前景/背景分割。语义分割有助于模型区分包括背景在内的不同语义类的对象,而方向预测,估计每个像素朝向其相应中心的方向,实现分离同一语义类的实例。

目前技术不足:

目前最先进的实例分割模型FCIS [1]采用位置敏感的[2]内/外得分图来编码前景/背景分割信息。内部/外部分数图的使用成功地在每个预测的边界框内分割了前景/背景区域,但由于背景编码的冗余,这也使输出通道的数量加倍。

另一方面,先前[3]的工作产生三个输出:语义分割,实例中心方向(预测像素朝向其对应实例中心的方向)和深度估计,然而,随后又要采用复杂的模板匹配来解码预测的方向以进行实例检测。

论文改进点:

论文针对以上两个不足,一方面,采用包括背景类的像素方式分类信息的语义分割预测来区分不同语义类别(例如,人和背景)的对象,从而去除[1]中的背景编码冗余,另一方面,方向预测用于分离相同语义标签的对象实例。论文模型采用了与[1,2]中相同的组装操作来收集方向信息,从而摆脱了[3]中使用的复杂模板匹配。

除此之外,论文还采用

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值