【论文笔记】CVPR2019_SiamMask


论文题目: Fast Online Object Tracking and Segmentation: A Unifying Approach

概述

  1. multi-task learning, 同时实现VOT和VOS。
  2. 只需要单一的bounding box来做初始化,就可以在跟踪过程中实时的输出分割掩码。速度35fps。
  3. 不需要在线微调。

在SiamRPN++的基础上(SiamMask使用的是ResNet50作为backbone,这个与SiamRPN++相同),设计了语义分割分支,输出精确的分割掩码,可以用来代替原先的目标框。而且在完成跟踪任务的同时,也实现了VOS任务。

和SiamFC做对比

SiamFCSiamMask
multi-taskTracking onlyTracking & Segmentation
backboneAlexnetResNet-50
Loss functionlogistic lossLogistic loss + cross-entropy + smooth L1
predicted boxAxis-aligned boxminimum bounding rectangle(最小外包矩形)
speed58fps35fps

网络结构

在这里插入图片描述在做correlation之前,和SiamFC是一样的,区别在于,correlation操作使用的是11256的卷积核,输出的是1717256的特征图(SiamFC输出的是17171,直接做预测)
在这里插入图片描述
两分支的Loss相当于是SiamFC+ mask分支,三分支的Loss相当于MaskRPN + mask分支。

分割分支的设计

这块是本文的一大 创新点,分割部分的设计只有两层网络,而且分割分支的输入也是将模板分支和检测分支的feature map同时输入进去进行编码的,这样一来,如果以其它目标作为template,那么相应的,mask也会变成对应的目标的掩码。

为了能使分割分支输出比较精确的结果,作者使用了下图的refinement module,使用了多个尺度的特征图融合,来得到mask的输出。

在这里插入图片描述

网络backbone部分结构参数

在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值