Low-Latency Video Semantic Segmentation (CVPR 2018)

Low-Latency Video Semantic Segmentation (CVPR 2018)

本文目标任务:视频语义分割,论文地址
原创文章, 不可转载!!


同样从[1]改进而来,仍然采取key frame和current frame的思路,主要思路为比较两帧的底层特征的差异,若差异较大,则按部就班地产生最后的结果;若差异较小,则采取一种创新性的方法根据关键帧的top feature和两帧底层特征的差异产生当前帧的top feature,最后得到分割结果,流程如下:

screenshot from 2019-03-08 19-23-16.png

创新点:

  1. 关键帧的选取策略,与[2]相似,取两帧特征的差值作为输入,最后输出结果,不过[2]中针对这一结果进行了训练,而这里没有。
  2. Adaptive Feature Propagation,本文的主要创新点。[1][2]都是使用光流根据函数W产生结果,而本文是将关键帧的top feature经过一个卷积核(文中称它为spatially variant convolution. )的运算来生成当前帧的top feature。而卷积核的参数是由两帧的底层特征卷积运算而来,如下图

screenshot from 2019-03-08 19-24-02.png

  1. Low-Latency Scheduling(just a trick, please read paper!)

实验结果(仅列出cityscape上结果):比同期的[2]效果好,可能和baseline的选取也有关。

screenshot from 2019-03-08 19-24-34.png

Propagation方法比较

screenshot from 2019-03-08 19-54-11.png

关键帧选取策略的比较

screenshot from 2019-03-08 19-56-28.png

Inference时间分析

screenshot from 2019-03-08 19-57-57.png

具体效果图见论文

[1] Deep feature flow for video recognition

[2] Dynamic Video Segmentation Network

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值