显著性检测（一）Saliency Detection: A Spectral Residual Approach

最新推荐文章于 2024-09-09 09:00:00 发布

黑脸月球

最新推荐文章于 2024-09-09 09:00:00 发布

阅读量7.8k

点赞数 4

分类专栏： Saliency

本文链接：https://blog.csdn.net/dawnlooo/article/details/78068797

版权

本文介绍了一种基于频谱残差的视觉显著性检测方法，由上海交大侯晓迪在2007年提出。该算法在频域中分析图像，通过减去背景的平滑频谱曲线，突出图像中的显著变化区域，实现目标与背景的区分。这种方法具有特征无关性和尺度不变性，能有效检测图像中的显著目标。

摘要由CSDN通过智能技术生成

这篇文章来自2007CVPR，作者侯晓迪当时在上海交大读大三，后进入加州理工学院攻读博士，师从Koch。这篇文章创建了基于频谱的视觉注意机制，它与Itti等人的基于特征层次的显著性模型不同，作者从一开始就提出，这是一种与特征无关的普适性算法。作者将图像映射到频率域中，通过不同图像在频率域中的分布规律，得出了谱残差模型，原文Matlab代码仅有5行，非常简洁高效。
原理：我们一般把图像分为目标和背景，传统的显著性模型是提取目标的特定特征，这样的方法就决定了目标种类的特定性，也就导致了这种方法的局限性。一般认为视觉注意机制分为两个阶段：一个是并行快速简单的预注意阶段，然后是单行缓慢但是复杂的注意阶段。人类倾向于关注那些有显著变化的区域，而对大部分的相似的区域不予关注。因此，在图像中将平淡的背景剔除掉，剩下的就是显著区域。
模型：从信息理论的角度，图像信息H(Image)可以分为两个部分：
H(Image)=H(Innovation)+H(Prior Knowledge)
H(Innovation)代表图像中的“新奇”区域，H(Prior Knowledge)代表需要被去除的冗余的信息，作者认为这些冗余信息有着可预测的分布。
尺度不变性有一个理论：
E{A(f)}∝1/f
也就是幅频响应中某个频率的幅度平均值和频率倒数成正比。如下图。