这篇文章来自2007CVPR,作者侯晓迪当时在上海交大读大三,后进入加州理工学院攻读博士,师从Koch。这篇文章创建了基于频谱的视觉注意机制,它与Itti等人的基于特征层次的显著性模型不同,作者从一开始就提出,这是一种与特征无关的普适性算法。作者将图像映射到频率域中,通过不同图像在频率域中的分布规律,得出了谱残差模型,原文Matlab代码仅有5行,非常简洁高效。
原理:我们一般把图像分为目标和背景,传统的显著性模型是提取目标的特定特征,这样的方法就决定了目标种类的特定性,也就导致了这种方法的局限性。一般认为视觉注意机制分为两个阶段:一个是并行快速简单的预注意阶段,然后是单行缓慢但是复杂的注意阶段。人类倾向于关注那些有显著变化的区域,而对大部分的相似的区域不予关注。因此,在图像中将平淡的背景剔除掉,剩下的就是显著区域。
模型:从信息理论的角度,图像信息H(Image)可以分为两个部分:
H(Image)=H(Innovation)+H(Prior Knowledge)
H(Innovation)代表图像中的“新奇”区域,H(Prior Knowledge)代表需要被去除的冗余的信息,作者认为这些冗余信息有着可预测的分布。
尺度不变性有一个理论:
E{A(f)}∝1/f
也就是幅频响应中某个频率的幅度平均值和频率倒数成正比。如下图。
显著性检测(一)Saliency Detection: A Spectral Residual Approach
最新推荐文章于 2024-09-09 09:00:00 发布
本文介绍了一种基于频谱残差的视觉显著性检测方法,由上海交大侯晓迪在2007年提出。该算法在频域中分析图像,通过减去背景的平滑频谱曲线,突出图像中的显著变化区域,实现目标与背景的区分。这种方法具有特征无关性和尺度不变性,能有效检测图像中的显著目标。
摘要由CSDN通过智能技术生成