人的视觉感知理论

     人类信息处理的过程是一个一项重要的心理调节活动。通常,实际场景图像除了包含感兴趣的目标之外,通常还包含着大量干扰信息。认知心理学研究表明,在分析复杂的输入景象时,人类视觉系统采取了一种串行的计算策略,即利用选择性注意机制,根据图像的局部特征,选择景象的特定区域,并通过快速的眼动扫描,将该区域移到具有高分辨率的视网膜中央凹区,实现对该区域的注意,以便对其进行更精细的观察与分析。视觉注意机制能够帮助大脑滤除其中的干扰信息,并将注意力集中在感兴趣的目标上。这可看作是将全视场的图像分析与景象理解通过较小的局部分析任务的分时处理来完成。

人的视觉感知过程基于一个重要的理论,即特征整合理论和两种机制,即自下而上的机制和自上而下的机制。

 “特征整合理论”认为,视觉注意机制的作用是把目标的各种属性以一种恰当的方式整合在一起,形成了目标雏形。Tresiman认为在视觉注意的初期,输入信息被拆分为颜色、亮度、方位、大小等特征并分别进行平行的加工,在这一过程中并不存在视觉注意机制,视网膜平行的处理各种特征;在此之后,各种特征将会逐步整合,整个整合过程需要视觉注意的参与,最终形成显著性图。如下图所示:

   实际上,人类选择性视觉注意实质是一种复杂的心理活动,它涉及感觉、知觉、知识和记忆等多种因素。他不仅需要自底而上的这种没有明确目标的视觉注意机制来辨识目标,比如“看看这是什么”,而且还需要自顶而下的这种含有明确目标的视觉注意机制来搜索目标,比如“找一个红色苹果”。我们的算法在做一些图像的检测和识别时,人类的视觉注意机制可以借鉴。我们可以提取不同属性的特征,包括:强度、颜色、方向、运动和立体差异来综合形成显著性图。先定位出目标,然后再做进一步的分析和识别,或者建立一个关于含有目标信息特征的样本库,然后通过搜索检测得以定位目标。

阅读更多
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页