概述
本文主要调研基于视频的语义分割,主要是对一些公开学习资源的整理,方便按步骤详细学习,调研主要分为以下几个方面:背景及应用 、最新进展以及代码实现、
背景及应用
目前基于图像的语义分割已经可以做到非常好,但是面对单帧观测不好,遮挡,运动模糊,光照不好等情况效果不好,而实际机器人在环境中是可以对环境进行连续长时间的观测,在时间上有很多的信息冗余,从数据融合的角度考虑,大量的数据冗余可以抵消观测中的噪声,所以理论上用视频做图像或者视觉任务应该比单帧能达到更好的效果,目前这个研究方向逐渐向机器学习,深度学习方向靠拢,近两年也有些效果不错的工作。主要可应用于机器人,无人机,无人驾驶,智能拍照等
最新进展与其代码实现
cite | Paper(Year) | title | Code |
---|---|---|---|
CVPRW2017 DAVIS2017 1st | Video Object Segmentation with Re-identification | ||
CVPRW2017 DAVIS2017 2nd | Lucid Data Dreaming for Object Tracking | ||
CVPRW2017 DAVIS2017 3rd |