点击上方“小白学视觉”,选择加"星标"或“置顶”
重磅干货,第一时间送达
如今,照片逼真的编辑需要仔细处理自然场景中经常出现的颜色混合,这些颜色混合通常通过场景或对象颜色的软选择来建模。因此,为了实现高质量的图像编辑和背景合成,精确表示图像区域之间的这些软过渡至关重要。工业中用于生成此类表示的大多数现有技术严重依赖于熟练视觉艺术家的某种用户交互。因此,创建如此准确的显著性选择成为一项昂贵且繁琐的任务. 为了填补熟练视觉艺术家的空白,我们利用计算机视觉来模拟人类视觉系统,该系统具有有效的注意力机制,可以从视觉场景中确定最显着的信息。这类问题也可以解释为前景提取问题,其中显着对象被视为前景类,其余场景为背景类。计算机视觉和深度学习旨在通过一些选择性研究分支对这种机制进行建模,即图像抠图、显著目标检测、注视检测和软分割。值得注意的是,与计算机视觉不同,深度学习主要是一种数据密集型研究方法。
随着近年来使用全卷积网络 (FCN) 进行图像分割的兴起,深度学习显著改善了前景提取和显著性检测基线。尽管有这些改进,但大多数建议的架构使用最初为图像属性分类任务设计的网络主干,它提取具有语义意义的代表性特征,而不是全局对比度和局部细节信息。
这是一个分割问题吗?
是的,如果我们从输出格式的角度来看,这是一个分割问题。近年来,语义分割已成为计算机视觉和深度学习领域的一个关键问题。因此,从更大的场景来看,我们可以说语义分割是该领域的关键任务之一,它为更好地理解场景铺平了道路。从图像和视频中推断认知事实的应用越来越多,这也突出了场景理解的重要性。
细粒度语义分割的三种方法:
图像抠图
显着目标检测 (SOD)
软分割
图像抠图
图像抠图可以理解为绿屏抠像的广义版本,用于在无约束设置中精确估计前景不透明度。图像抠图是计算机图形学和视觉应用中一个