利用帧间相关性的视频语义分割

0. Points

  • CRF models on video data can fuse the predicted label information across frames
  • Joint Semantic Segmentation and 3D
    Reconstruction from Monocular Video. ECCV 2014. video
  • Joint optical flow and temporally con- sistent semantic segmentation. page 4. “Optical flow with semantics”, ECCV 2016
  • Optical flow with semantic segmentation and localized layers. CVPR 2016
  • Video propagation networks. CVPR 2017

1. Semantic Video CNNs through Representation Warping. ICCV 2017

Github | video

1.1 Results(visualization)

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

1.2 Flow Path

在这里插入图片描述
在这里插入图片描述

  • Transform Flow
    是一个借鉴了ResNet的小型4层CNN的网络,输入pair的init image以及difference,以及计算得到的光流 。在第三层的时候,又输入了原始的init image

没有利用关键帧

2. Deep Feature Flow for Video Recognition. CVPR 2017

Github | Video

在这里插入图片描述
关键帧5,10对应于两个数据集
光流的估计函数是用CNN处理。

3. Low-Latency Video Semantic Segmentation. CVPR 2018

自适应选择关键帧
在这里插入图片描述

4. Dynamic Video Segmentation Network. CVPR 2018

在这里插入图片描述
之后利用decision network的score,与threshold==93%做了自适应关键帧的选择。则cityspace上达到了19fps的速度。

SemanticFusion: Dense 3D Semantic Mapping with Convolutional Neural Networks. 2017 ICRA

关键帧 10 on dataset NYUV2
在这里插入图片描述
这里的CNN是选择了VGG的一个简化版,只有两层deconvolution, for tradeoff between accuracy and speed. 为了使用depth,但是实际上第四个通道使用了rgb的average intensity 然后做了一个映射

MaskFusion: Real-Time Recognition, Tracking and Reconstruction of Multiple Moving Object. ISMAR 2018

在这里插入图片描述

Fast and Accurate Semantic Mapping through Geometric-based Incremental Segmentation. IROS 2018

在这里插入图片描述
在这里插入图片描述

评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值