One-Shot Video Object Segmentation理解

最新推荐文章于 2024-08-19 13:35:27 发布

dreamweaverccc

最新推荐文章于 2024-08-19 13:35:27 发布

阅读量1.7k

点赞数 1

文章标签：视频物体分割 OSVOS

本文链接：https://blog.csdn.net/dreamweaverccc/article/details/90374742

版权

Caelles S , Maninis K K , Pont-Tuset J , et al. One-Shot Video Object Segmentation[C]// 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). IEEE, 2017.

一、论文概括

本文主要提出了一个新型的CNN架构OSVOS，用以处理视频物体分割的问题，即对视频中的每一帧图像分成两类：前景（foreground）和背景（background），前景就是需要检测出的物体。OSVOS的全称为One-Shot Video Object Segmentation，即一次视频物体分割。如下图所示，OSVOS只需输入视频的第一帧图像中物体的掩膜（红色位置），就可以识别中该视频接下来的每一帧中物体的掩膜（绿色位置）。

在这里插入图片描述
OSVOS的架构分为三步：（1）基于ImageNet预训练一个基础CNN网络（Base Network），其作用是学习图像的一般性表示。（2）基于DAVIS的训练集和基础网络训练一个父母网络（Parent Network），其作用是学习DAVIS图像的表示，并初步对物体进行分割。（3）基于特定物体视频的第一帧图像，训练一个测试网络（Test Network）对Parent Network