One-Shot Video Object Segmentation论文笔记

最新推荐文章于 2024-03-22 00:04:34 发布

VoNho

最新推荐文章于 2024-03-22 00:04:34 发布

阅读量753

点赞数

分类专栏： cnn deep learning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_38056657/article/details/80521615

版权

cnn 同时被 2 个专栏收录

11 篇文章 0 订阅

订阅专栏

8 篇文章 0 订阅

订阅专栏

要解决的问题

半监督的视频目标分割

方法

给出一帧或多帧人工标注的分割掩码，学习追踪特定目标的模型，然后将后续的视频序列的所有像素分割为前景与背景

原理

基于一个Fully-CNN，可以连续的传递generic semantic information（在ImageNet上学习，用于前景分割任务），最后学习test sequence的single annotated object的表现

论文贡献

1. 针对一个特定的目标实例，给出一幅标注的图像，对video object segmentation预训练出一个image recognition的模型（首先对一系列带有人工标注目标的视频进行训练，然后在测试阶段，对人工标注单帧图像做fine-tuning）

2. 对视频的每帧进行独立处理，即从每个人工分割的帧得出目标的模型

3. 可以对speed和accuracy进行权衡（可以选择fine-tuning的级别；可以标注更多的帧）

FCN

将最后一层fully connected layer换成一个1*1的convolution，就可以做到训练任何大小的图像（免去了patch-based方法的冗余计算；移除fully connected layer减少了训练的参数）

训练FCN：首先，对大量目标进行训练，构建出一个可以区分前景的模型（offline）；然后在test time，对要进行分割的网络做fine-tuning

Criteria for CNN

1. 对目标的准确定位

2. 较少的训练参数

3. 相对较快的测试时间

pixel-wise cross-entropy loss

modified version（平衡两个二进制类）

Training

Offline training

1. 在ImageNet上预训练，为图像做标签（base network）

2. 在DAVIS训练集的二进制掩码上训练网络，学习出一个分割目标的方法（parent network）

3. 给出第一帧图像及其分割，对parent network进行训练、fine-tuning，然后对整个序列用新的权重进行测试，分割出视频多有的帧（test network）

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。