刚接到显著性检测的任务不久,看了一些相关的论文,感觉问题还是挺多的,结合自身的学习感受,提一些问题以便往后明确方向。
首先要明白什么是视觉的显著性。我们人眼在看一幅场景的时候,首先会被该场景中最‘刺眼’或者最‘引人注目’的某一个局部所吸引,虽然该过程对我们来说瞬间发生,再简单不过了,但这个过程要想明白到底发生了什么其实还是挺麻烦的。这个局部就是该视觉场景中最显著的区域。所以视觉显著性检测其实就是让计算机模拟人或灵长类生物在这一瞬间所做的工作,即如何从一整幅视觉场景中找到最‘引人注目’的局部。
明白了什么是显著性,那么下一个问题就是为什么要研究显著性?其实研究视觉显著性是研究其他计算机视觉问题的基础。举个最简单的例子,桌面上放一本书,如果你事先不知道,你在看桌面的瞬间就知道书放在哪里,然后你就可以开始学习了。所以,你要想学习,就必须要知道书放在桌面什么地方,而你看桌面的时候,其实就已经完成了一次显著性检测,检测之后就可以对该显著性区域进行识别,识别出来该区域到底是什么才可以做后续工作。这是显著性检测用于识别预处理的例子。其他的如图像分割,文本检测,人脸识别等都有显著性的影子。
了解了是什么,为什么,接下来应该是怎么做的问题。如果机器能和人脑相比,那么显著性检测的重要性便不复存在。虽然现今的神经网络得到了长足的发展,但仍无法和生物神经系统相比。现今提出的显著性检测模型基本上都是基于Koch和Ullman最早提出的生物启发模型,即视觉注意