-
Title: A Generalized Framework for Video Instance Segmentation
-
Affiliation: Yonsei University
-
Authors: Miran Heo, Sukjun Hwang, Jeongseok Hyun, Hanjung Kim, Seoung Wug Oh, Joon-Young Lee, Seon Joo Kim
-
Keywords: Video Instance Segmentation, Long Videos, Query-based Training Pipeline, Sequential Learning, State-of-the-art Performance
-
Summary:
-
(1): 本文针对视频实例分割 (VIS) 的长视频及复杂和遮挡的场景提出了一个通用的框架。对于这些情况,过去的方法存在许多限制,本文旨在解决这些问题。
-
(2): 传统的针对长视频的方法需要在训练和推理之间建立联系,这是目前方法存在的主要瓶颈,新的方法需要界定这种联系。 本文提出了一种新的学习策略,其中包括基于查询的训练流程,以及一种新的目标标签分配方法。此外,我们引入了一种记忆方法,有效地获取先前状态的信息。与传统方法不同的是,本文聚焦于构建不同帧或片段之间的关系,可以在在线和半在线方式中灵活地执行这种关系的构建。
-
(3): 本文提出了一个新的学习策略,包括基于查询的训练流程和一种新的目标标签分配方法。同时,我们引入了一种记忆方法,有效地获取先前状态的信息。与传统方法不同的是,本文聚焦于构建不同帧或片段之间的关系,可以在在线和半在线方式中灵活地执行这种关系的构建。
-
(4):