利用帧间相关性的视频语义分割

最新推荐文章于 2022-07-29 11:00:49 发布

霜桥月馆

最新推荐文章于 2022-07-29 11:00:49 发布

阅读量2.5k

点赞数 1

分类专栏： paper之路

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/renhaofan/article/details/89791134

版权

paper之路专栏收录该内容

4 篇文章 7 订阅

订阅专栏

0. Points

CRF models on video data can fuse the predicted label information across frames
Joint Semantic Segmentation and 3D
Reconstruction from Monocular Video. ECCV 2014. video
Joint optical flow and temporally con- sistent semantic segmentation. page 4. “Optical flow with semantics”, ECCV 2016
Optical flow with semantic segmentation and localized layers. CVPR 2016
Video propagation networks. CVPR 2017

1. Semantic Video CNNs through Representation Warping. ICCV 2017

1.1 Results(visualization)

在这里插入图片描述

1.2 Flow Path

在这里插入图片描述

Transform Flow
是一个借鉴了ResNet的小型4层CNN的网络，输入pair的init image以及difference，以及计算得到的光流。在第三层的时候，又输入了原始的init image

没有利用关键帧

2. Deep Feature Flow for Video Recognition. CVPR 2017

在这里插入图片描述
关键帧5，10对应于两个数据集
光流的估计函数是用CNN处理。

3. Low-Latency Video Semantic Segmentation. CVPR 2018

自适应选择关键帧
在这里插入图片描述

4. Dynamic Video Segmentation Network. CVPR 2018

在这里插入图片描述
之后利用decision network的score，与threshold==93%做了自适应关键帧的选择。则cityspace上达到了19fps的速度。

SemanticFusion: Dense 3D Semantic Mapping with Convolutional Neural Networks. 2017 ICRA

关键帧 10 on dataset NYUV2
在这里插入图片描述
这里的CNN是选择了VGG的一个简化版，只有两层deconvolution, for tradeoff between accuracy and speed. 为了使用depth，但是实际上第四个通道使用了rgb的average intensity 然后做了一个映射

MaskFusion: Real-Time Recognition, Tracking and Reconstruction of Multiple Moving Object. ISMAR 2018

在这里插入图片描述

Fast and Accurate Semantic Mapping through Geometric-based Incremental Segmentation. IROS 2018

在这里插入图片描述

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
8
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 8

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。