这篇文章主要介绍利用深度学习的显著目标检测,对比各类算法探究形成综述。
原文地址:https://arxiv.org/pdf/1904.09146.pdf 若有个人误区及翻译错误,请及时评论指正。
目录
【第一章】介绍 6.23更新
【第二章】深度显著目标检测模型 6.24-6.25更新
【第三章】目标检测数据集 6.26更新
【第四章】评估指标 6.27更新
【第五章】基线和分析 6.27更新
【第六章】讨论 6.28更新
【第七章】总结 6.28更新
前言
作为一个重要的计算机视觉研究问题,近年显著目标检测(SOD)吸引了越来越多研究者的关注。意料之中的是,显著目标检测的最新研究已经由深度学习方法所主导(deep SOD),多百篇该领域文章的发表予以了印证。为了促进对深度显著目标检测的理解,本文提供一个全面的调查,涵盖多个算法的分类以及未解决的开放问题。首先,我们从不同的角度审视了SOD算法,从Network的架构,监督的级别,学习范式以及对象/实例的级别检测。之后,我们总结了现有的SOD评估数据集及评估标准。然后,我们根据他人已有的工作编制了一个覆盖主流SOD方法的基准,提供详细的结果分析。并且我们研究了不同SOD算法在各类数据集上的表现。最后,我们讨论了几个SOD未解决的问题的挑战,并且指出今后的潜在研究方向。所有的显著性预测图、构建的带注释的数据集,以及评估方法的代码都在https://github.com/wenguanwang/SODsurvey获取。
第一章:介绍
显著目标检测的目的是突出图像中的显著目标区域。凝视点检测(fixation prediction)起源于认知和心理学研究,与凝视点检测不同的是,目标检测受各种领域应用驱动:比如,在CV研究中,SOD可以应用于图像理解,图像描述,目标检测,无监督的视频目标分割,语义分割,行人重识别,等等;在计算机图形学中,SOD可以应用于非真实性渲染,图像自动裁剪,图像重定位,视频摘要等;在机器人领域中,可用于人机交互和目标发现等等。
得益于深度学习技术,显著性检测得到飞速发展。从2015年首次被介绍,深度SOD算法一直有着比传统算法更卓越的表现,并且在各类基准测试排行中霸榜。
第一节:History and Scope
与计算机视觉的其他任务相比,SOD的历史相对短暂。传统SOD模型主要依赖于低级特征并且受到如颜色对比、背景先验的启发。为了获得显著对象和清晰的对象区域,区域生成、超像素、OP算法(Object Proposals)经常集成于过分割过程。如下图Fig.1所示。
2015年以来,各类深度学习SOD相继提出。早期的SOD深度模型主要利用多层感知机分类器来预测从图像的每个处理单元提取的深度特征的显著性得分。之后,全卷积网络(FCN)成为了更主流的SOD架构。简要的SOD发展年表图如Fig.1。本文主要涵盖过去5年的研究进展,也为了完整性的需要,还包括了一些早期的相关工作。需要注意的是,本文主要注重单图像级别的显著性检测,将实例级SOD、RGB-D SOD、co-saliency detection、video SOD、FP、social gaze prediction 当做其它topic。
第二节:Related Previous Reviews and Surveys
Table 1 列出了已有综述。在文章2中,Borji等人审视了2015年之前的SOD方法,因此不涉及深度学习解决方案。最近,如文章4,综述研究已经扩展到传统非深度学习方法与深度学习方法的研究。文章5中,对协同分割(co-segmentation)的方法进行了分析,这是视觉显著性的一个分支,可以检测并分割来自多个相关图像的显著位置。文章6对几个SOD的扩展任务,如RGB-D SOD、co-salency detection 和 视频SOD进行了综述。文章7研究了目标检测的几个子方向,并总结了目标检测,显著目标检测,指定物品检测(CO