SG-Net

论文地址:[2103.10284] SG-Net:用于单阶段视频实例分割的空间粒度网络 (arxiv.org)icon-default.png?t=N7T8https://arxiv.org/abs/2103.10284

导言:

一、该算法之前,性能最好的VIS方法是Mask R-CNN

        该算法通过添踪分支段Mask R-CNN,留下大量改进空间

二、本文提出了一种单阶段SG-Net

        与传法相比,有4

        1)具架构, 每个任务(分割)因此它们可;

        2)在个检测实例度的高质量;

        3)每个任都避使基于建议的RoI大大时复杂度;

        4)跟有效地增强性。

简介:

一、视频 分割 (VIS): 一个 行检测、分割 务。
二、开创性的工作MaskTrack R-CNN:
        基本步骤:MaskTrack R-CNN遵 范式, Mask R-CNN MaskTrack RCNN首 使 Faster R-CNN 网络(RPN) 建 议的 (RoI) 个任 务头中 分别
       
        问题 一些
        首 两阶段 ( 分割 ) 享特征 架构 来麻 ;
        其 RoI 特征被 ( Mask R-CNN 中14 × 14 28 × 28 ) 出分辨 , 因为
        第三 终预测 议的RoI 要一堆 ( mask R-CNN 3 × 3 积层) 够大 上下文。 帧上出 增加而 大大

        新角度:将VIS中的检测、分割和跟踪这三个子任务都视为相互关联的问题,应相互考虑。

        实例分割的早期模型BlendMaskCondInst

        优点:它 们 都 立 在FCOSMask r - cnn它们只使(FCN)架构RoI操作(RoIpoolRoIAlign)改 进显界 的细了一个掩模头使很强棒性。

        缺点:分割, 而忽

        研究动机:如何的两阶VIS一个

        主要贡献:

        1)从一个新的角度设计了一SG-Net方法动划分上进行分割命名SG-Net。 与MaskTrack R-CNN了更有分割以丰富对细节,(1)

        2) 该 使 能 够将 务分 可承受 阶 段方
        3)整个 架构 进 的单 标检 FCOS
有机 个任 使 效地共
        4)跟 简 单有 MaskTrack R-CNN 的 跟踪 的目 变化 具 有更

相关工作:

        一、目标检测:

        单阶更快的与两一 阶段

        最目 标检测(FCOS CenterNet )除框锚测流义锚点测 特征FCOS 和CenterNet 不仅且 保持度。        

        单阶 有利于 分割 操作引 SG-Net FCOS
        二、实例分割
        主流 分割 基 于Mask R-CNN RoI 选建议 RoI
        最近 YOLACT SipMask BlendMask 基于Mask R-CNN 分割 YOLACT和SipMask 并使用 们与 测相结 (YOLACT) 2 × 2 分别 区域(SipMask) 设计 能无法 BlendMask首先 2D 力图, 由于BlendMask 分割 它对对 象细节
        受 该方法 对对 对象的 划分 为不 进行分割
        三、多目标跟踪
        最近 测的时 一些 使 滤波或 他人
识别消 。SG-Net 跟踪范
         使 踪线索 FCOS
centerness 优化检
        四、视频实例分割
        大多数 VIS Mask R-CNN的 但存在 :

        1)跨享不,难以实现网络体系结构的联合优化;

        2)实例掩码的质量受到RoI();

        3) RoI特有冗余的影响与两SG-Net一个阶段(RoI)框的(RoI)同时产。SG-Net个任相互依

SG网

        一、整体架构

        SG-Net包 一个 取主干 一个 一个 一个
们的 架构 2 示。骨干网采用ResNet和FPNs。利用fpn的{ P3 , P4 , P5 , P6 , P7}特
并应 务。检测采用原始的FCOS,它由分类,框回
t i th 示 为D i t = (c i t , o i t , b i t ) , c i t ∈ { 0 , ..., C 1 } 对 象的 o i t R 2 b i t R 4 是对象
         二、Mask Head
        三部分组成:1)空间注意力模块;2)掩模模块;3)混合模块。
        空间 : 界框划分
( 3 绿 ) 使 边界框 b 1 , .., b n 模块。 划分为r 1 × r 2 r 1 , r 2 = min(6 , w/ 50)min(6,h/50) 其中 w h 分别 50 以像素 BlendMask ] 征池化 3D 每个P 3 P 7 两个 3 × 3 区域预 1D 力分 ( YOLACT 系数) 力分 义为A = { a j R | j = 1 , ..., r 1 × r 2 } a j j th 域的注 力分 。ya
        掩码模块:
        基掩 线 两个主 :1) 提取和 FPNs ;2)

        混合模块:

        将注力分和基本以产码。

        三、Tracking Head

         使
  • 23
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值