《MaskTrack:Learning Video Object Segmentation from Static Images》论文笔记

本文介绍MaskTrack方法,它结合离线和在线学习策略,使用静态图像进行视频对象分割。通过前一帧掩模引导网络并利用在线目标跟踪优化,即使在仅用边界框标注或分割图的情况下也能实现精确分割。实验表明,引入光流信息能进一步提升分割效果。
摘要由CSDN通过智能技术生成

参考代码:MaskTrack

1. 概述

导读:这篇文章借鉴了实例分割与目标跟踪的思想,从而得到视频分割方法MaskTrack。文章的方法使用静态图像(非标注的视频序列)就可以完成训练工作,并且输入的信息可以为边界框、分割图或是合并多个带注释的帧,输入的范围很宽泛,这就使其可以运用到不同的场合下去。这篇文章的重点是将离线(从上一帧预测结果上生成优化之后的掩膜)和在线学习(获取特定的实例目标分割结果)策略互补地组合起来实现更加精细的目标分割。

这篇文章提出的方法使用相邻两帧之间的相关性,而不是多帧之间或是整个视频序列的相关系进行视频分割,其中对于分割质量较为关键是两个策略:在线与离线学习策略

  • 1)离线学习:这里使对图像掩模进行变形和粗糙化,以训练网络可以根据其粗略估计输入生成准确的输出掩模;
  • 2)在线学习:这里将目标跟踪里面的思想迁移到视频分割里面,并使该方法能够根据新输入视频中感兴趣的对象轻松地进行优化;

2. MaskTrack方法设计

这篇文章将视频目标分割从另外一个角度转换为引导的实例分割。也就是从现有分割网络的基础上(例如文章说到的DeepLabv2)转换并训练它实现逐帧的实例分割。这样带来一个问题是怎么让网络知道哪个实例需要进行分割?对此文章提出两个互补的策略去解决这个问题。

  • 1)通过离线学习使用预估出来的前一帧掩膜引导网络偏向于目标实例;
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值