【CVPR2023新作】视频实例分割通用框架

NeRFAI

已于 2023-08-16 07:43:47 修改

阅读量157

点赞数

分类专栏： CVPR2023论文解读文章标签：算法人工智能机器学习深度学习计算机视觉

于 2023-08-13 16:42:35 首次发布

本文链接：https://blog.csdn.net/NeRFAI/article/details/132261181

版权

Title: A Generalized Framework for Video Instance Segmentation
Affiliation: Yonsei University
Authors: Miran Heo, Sukjun Hwang, Jeongseok Hyun, Hanjung Kim, Seoung Wug Oh, Joon-Young Lee, Seon Joo Kim
Keywords: Video Instance Segmentation, Long Videos, Query-based Training Pipeline, Sequential Learning, State-of-the-art Performance
Summary:

(1): 本文针对视频实例分割 (VIS) 的长视频及复杂和遮挡的场景提出了一个通用的框架。对于这些情况，过去的方法存在许多限制，本文旨在解决这些问题。
(2): 传统的针对长视频的方法需要在训练和推理之间建立联系，这是目前方法存在的主要瓶颈，新的方法需要界定这种联系。本文提出了一种新的学习策略，其中包括基于查询的训练流程，以及一种新的目标标签分配方法。此外，我们引入了一种记忆方法，有效地获取先前状态的信息。与传统方法不同的是，本文聚焦于构建不同帧或片段之间的关系，可以在在线和半在线方式中灵活地执行这种关系的构建。
(3): 本文提出了一个新的学习策略，包括基于查询的训练流程和一种新的目标标签分配方法。同时，我们引入了一种记忆方法，有效地获取先前状态的信息。与传统方法不同的是，本文聚焦于构建不同帧或片段之间的关系，可以在在线和半在线方式中灵活地执行这种关系的构建。
(4):

关注