转-Efficient Salient Region Detection with Soft Image Abstraction笔记

针对已有的方法中存在的问题:

  1. Itti模型,针对Itti模型进行的扩展的显著性检测方法,以及光谱剩余假说系列的方法过分强调小的,局部特征,对对象级别的应用不适合;
  2. 对图像的全局属性进行建模的方法,虽然能够将整个对象较好地检测出来,但是计算复杂度高;
  3. 综上找到一种compact并且有效的表示方法很有必要。这样的方法有颜色平均值或亮度平均值表示。但是一阶平均太简单,忽略了颜色的方差以及图像各部分之间的空间关系;
  4. 近期,Cheng提出了一种基于区域对比度的方法来对全局显著性进行建模,但是由于这种方法使用了image segments,不太容易对空间分布进行建模。

本文提出的方法既考虑了全局唯一性,有考虑了颜色的空间分布。具体步骤如下:

  • 用GMM对颜色进行聚类
    1. 对RGB颜色空间进行量化,将R,G,B均匀量化成12阶,然后计算各通道的直方图,将出现频率高的阶留下,总的像素的覆盖比率为95%;
    2. 计算量化后的颜色的协方差矩阵,进而估计GMM中的其余参数,即均值和后验概率。GMM的component的个数为15。
  • spatial overlap based component clustering
    1. 对于图像中的每一个像素,均可以获得一个向量P=[p1, .., p15],保留P中前两个最大元素,P中其余元素置为0
    2. 对于每一个分量,先进行一个3*3的均值滤波
    3. 计算两个clusters之间的空间一致性C(ci, cj),得到一个pairwise coponent correlation矩阵。
    4. 进行聚类,得到C类。采用的方法是message-passing based clustering,correlation矩阵就用来衡量15个GMM分量之间的相似性。用message-passing based clustering的好处是不用指定聚类的数目。
  • 层次表示和索引
    1. 0层:所有的像素,可以生成一整全分辨率的显著图(元素个数等于图像的大小);
    2. 1层:直方图表示层(元素个数约为85);
    3. 2层:GMM表示层(元素个数为15);
    4. 3层:message-passing 聚类后的层(元素个数小于15);
    5. 底层与高一层具有对应关系,这种对应关系也应该保存。
  • 全局唯一性计算(Global Uniqueness)

  在2层,即GMM表示层计算GMM分量ci的全局唯一性,从而得到显著图。

  • 颜色空间分布(Color Spatial Distribution)

  在3层,即message-passing clustering后的表示层,计算颜色的空间分布,从而得到显著图。

  • GU和CSD的整合

V. Gopalakrishnan et al. 2009认为用权重组合单个的显著图并不是一个很好的选择,有时候甚至会变得更差。因此,作者借助于compactness中的假设,将空间差异更小的显著图做为最终的显著图。

实验部分

在MSRA1000上进行的实验,最终的PR Curve与SF相当,所以必定比GS_SP(ECCV2012)差。

本文来自:http://www.cnblogs.com/qingliu411/p/3541459.html

转载于:https://www.cnblogs.com/DeepVL/p/4085222.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Salient object detection是指在图像或视频中检测出视觉上显著的对象区域。通过这种技术,我们可以确定图像中最吸引人的部分,这对于许多应用程序,如图像编辑和视频压缩,非常有用。目前有多种方法用于实现Salient object detection。 一种可能的方法是利用对象检测或对象建议方法,例如FastRCNN,来提取候选对象边界框并进一步分割出其中的显著对象。另一种方法是利用边缘信息区分不同的显著对象。这些方法可以帮助我们在图像中找到显著的对象,并提取出它们的特征。 人类在视觉上能够自然地检测到显著的场景区域,并在注意到这些区域后进一步处理以提取更丰富的高级信息。计算机视觉领域的研究者对这种能力进行了深入研究,并将其应用于解决复杂的视觉问题,如场景理解。与视觉显著性相关的其他研究方向包括显著对象检测、注视预测、对象重要性、可记忆性、场景杂乱、视频趣味性、惊奇、图像质量评估等。 不幸的是,目前对于多个输入图像上的显著对象检测的研究还比较有限。这可能是因为可用于这些问题的基准数据集有限。然而,多模态数据的可获得性正在变得越来越容易,而利用诸如时空一致性和深度等附加线索将有助于更有效地进行显著目标检测。 总的来说,Salient object detection是一种用于检测图像或视频中显著对象区域的技术,可以帮助我们理解图像中最吸引人的部分,并在许多应用中发挥重要作用。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [【综述论文】Salient Object Detection: A Survey翻译整理](https://blog.csdn.net/weixin_45875199/article/details/106626397)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值