OSMN:Efficient Video Object Segmentation via Network Modulation

本文提出了一种名为OSMN的高效视频对象分割方法,通过网络调制在网络适应特定物体时减少梯度下降次数,无需大量参数调整。OSMN结合了条件批标准化、视觉和空间调制,利用视觉和空间信息来改善分割效果。视觉调制器从第一帧的标注中学习目标的语义信息,空间调制器利用目标的连续移动来预测位置。实验表明,这种方法在视频目标分割任务中表现出色。
摘要由CSDN通过智能技术生成

本文中,利用modulators快速地调整segementation networks使其可以适应特定的物体,而不需要执行数百次的梯度下降;同时不需要调整所有的参数。在视频目标分割上有两个关键的点:视觉外观和空间中持续的移动。为了同时使用视觉和空间信息,将visual modulator和spatial modulator进行合并,在第一帧的标注信息和目标空间位置的基础上分别学习如何调整main segmentation network。
在这里插入图片描述

Conditional batch normalization

在batch normalization的基础上,每个scale和bias参数都有第二个网络生成,每一层CBN网络可以如下定义,
y c = γ c x c + β c y_c = \gamma_cx_c+\beta_c yc=γcxc

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值