学习笔记：Salient Object Detection via Multiple Instance Learning(一)预备知识

最新推荐文章于 2024-04-19 09:47:30 发布

不变的svm

最新推荐文章于 2024-04-19 09:47:30 发布

阅读量780

点赞数

分类专栏：多示例学习在图像处理的应用

本文链接：https://blog.csdn.net/yxz3024/article/details/79778173

版权

多示例学习在图像处理的应用专栏收录该内容

3 篇文章 0 订阅

订阅专栏

预备知识：

目标检测（object detection），要求模型不仅能判断一幅输入图像中包含哪类目标，还得框出目标的具体位置（bounding box）。

显著性目标检测：是模拟人的视觉效果，根据人的视觉，提取出人感兴趣的部分，主要有两个过程，自底向上基于特征的数据数据驱动，另一个则是自顶向下的基于高层结构的任务驱动，这两个过程协调工作。由于自顶向下部分涉及生理学，神经学，心里学等诸多学科，且处于初级阶段。因而我们专注于自底向上的研究。

超像素：

超像素分割属于图像分割(image segmentation)，再细化应该属于过分割(over segmentation)。

特征对比度测度Contrast Cue

类的特征对比度测度定义为类与其他类的特征对比度，形式化描述如下：

其中为所有的图像的像素和，为聚类的像素个数。所以，类中像素个数越多，对特征对比度的贡献也就更大。

特征对比度与直方图对比度之间的不同：

这里衡量的是cluster的对比度，而直方图对比度衡量的是直方图的对比度；

对比度测度只是三个显著性测度中的一个。

特征对比度测度的优点：

cluster越是独特，cluster越是显著。

中心偏移测度Spatial Cue

偏移测度的依据是：人类视觉系统中，图像中心区域往往能够在比其他区域更加吸引人的注意。当对象与图像中心之间的距离越大时，显著性也就越来越减小。在单张图像中，称为中央偏向准则(center bias rule)。本文作者对这个概念进行了扩展，将其扩展到基于聚类的方法上。聚类的重心偏移测度定义如下：

与单张图像中的中心偏移测度不一样的是，这里定义的是多张图像上的全局中央偏向性

你对一幅图像进行超像素分割，分割之后，你得到许多大小不一的区域，你可以从这些区域中提取出有效的信息，比如颜色直方图、纹理信息。比如你有一个人，你可以对这个人的图像进行超像素分割，进而通过对每个小区域的特征提取，辨识出这些区域是处于人体的哪个部分（头部、肩部，腿部），进而建立人体的关节图像。

//此部分为转载：

能够在识别一个对象之前察觉它，非常接近自底向上的视觉显著性。根据显著性定义，广义的将相关领域的研究氛围三个类别：局部区域预测、显著性对象检测，对象状态建议。

局部区域检测：该模型旨在预测人眼移动的显著点。启发于神经生物学研究早期的视觉系统，Itti等人提出了第一个用于显著性检测的计算模型，此模型利用了多尺度图像特征的中心-周围的差异。Ma和Zhang提出了另一种局部对比度分析方法来产生显著性图像，并用模糊增长模型对其进行扩展。Harel等人提出了归一化中心分布特征来突出显著部分。尽管局部区域检测模型已经取得了卓越的发展，但其倾向于在边缘部分产生高显著性值，而不是均匀地突出整个对象，因此，这种方法不适合用于对象检测。

显著性对象检测：该模型旨在检测当前视野中最引人注意的对象，然后分割提取整个部分。Liu等人通过在CRF框架中引入局部，区域的，全局显著性测量。Achanta等人提出了频率调谐方法。Cheng等人提出了基于全局对比度分析和迭代图分割的显著性对象检测。更多的最新研究也试着基于过滤框架产生一些高分辨的显著性图，采用一些效果比较好的数据，或者是使用分层结构。这些显著性对象分割在简单的情景图像分析、内容感知编辑中可以达到很好的效果。而且可以作为一个便宜的工具处理大规模的网络图像或者是通过自动筛选结果构建鲁棒性好的应用程序然而，这些方法很少能够运用于包含多对象的复杂图像，但现实生活中，这样的图片确实最有意义的。

对象状态建议: 该方法并不做决定，而是提供一定数量（例如：1000）包含所有类别对象的窗口。通过产生粗糙分割集，作为对象状态建议已经被证实为一个减少分类器搜索空间的有效方式，而且可以采用强分类器提高准确率。然后，这两种方法计算量大，平均一张图片需要2-7分钟。Alexe等提出了一个线索综合性的方法来达到更好、更有效的预测效果。Zhang等人采用方向梯度特征提出了一个级联的排序SVM方法。Uijlings等人提出了一个可选择性的搜索方法老获得更好的预测效果。作者提出了一个简单直观的方法，相对于其他方法，达到了更好的检测效果，而且快于其他流行的方法1000多倍。

bing算法:通过使用对象状态得分来协助检测对象。动机来自于对象普遍是独立的，而且都具有很好定义的封闭轮廓。观察到将图像归一化到一个相同的尺度（例如：8*8）上，一般对象的封闭轮廓和梯度范数之间具有强联系。为了能够有效量化图像窗口中对象状态，将其重置大小为8*8，组合该窗口的像素梯度的幅值作为为一个64位的特征，通过级联的支持向量机框架学习一个通用的对象检测方法。而且这个二值化赋范特性（BING）,它可以很有效的用于一般对象估计。而且只需要一些CPU原子操作（例如加法，按位移动等）。大部分现存的先进方法，一般采用复杂的分类特征，而且需要采用加速方法以至于计算时间是可控的，相对于此，BING特征是简单朴素的。

算法流程：

//此部分为转载

不变的svm

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
学习笔记：Salient Object Detection via Multiple Instance Learning(一)预备知识

预备知识：目标检测（object detection），要求模型不仅能判断一幅输入图像中包含哪类目标，还得框出目标的具体位置（bounding box）。显著性目标检测：是模拟人的视觉效果，根据人的视觉，提取出人感兴趣的部分，主要有两个过程，自底向上基于特征的数据数据驱动，另一个则是自顶向下的基于高层结构的任务驱动，这两个过程协调工作。由于自顶向下部分涉及生理学，神经学，心里学等诸多学科，且处于初...
复制链接

扫一扫

专栏目录