显著检测——Information Maximization
本篇对Bruce等人在NIPS上发表的基于信息最大化的显著检测的文章做一简单的总结。这篇文章从信息论的角度来探讨显著性,在整幅图像中按照各位置局部范围所包含的信息多少量化显著程度。由于图像块的概率密度空间在很高的维度上,仅仅凭借测试图像的数据不足以满足统计需求。作者运用机器学习中的ICA方法在大量自然图像块中选取了具有代表性的少量图像块作为基,将测试图像中的所有块投影到这些基下。对投影系数按照概率密度估计的方法进行估计,并认为所有基是相互独立的,从而间接实现概率密度的估计。其基于的原动力是:信息是视觉注意背后的驱动力。
算法的总体框架如下
将大量随机获取的图像块通过ICA方法以选取出少量的基函数作为投影空间。从原图中取出各个位置的局部领域块,并分别在以上基下进行投影得到投影系数。对于每一个基下的投影系数用诸如直方图和窗函数的方法估计其概率密度,对应可求得在此基下的概率密度值。假定所有基之间是独立的,则最终在所有基下的概率密度是各个基下概率密度的乘积。转化成熵的形式便得到最终的显著图结果。
实验结果
AIM在图像的边缘无法进行计算,所以四周呈现出黑色。对于大多数自然图像来说,显著区域一般都不会位于图像的四周。这在一定程度上利用了先验信息,会因此而产生较好的数值结果。但分块的方式毕竟只限于特定的尺度,对于不同大小的显著区域没有适应性,会出现较大的性能波动。