双目立体视觉简介
1.
什么是视觉
视觉是一个古老的研究课题,同时又是人类观察世界、认知世界的重要功能和
手段。人类从外界获得的信息约有
75%
来自视觉系统,用机器模拟人类的视觉功能
是人们多年的梦想。视觉神经生理学,视觉心理学,特别是计算机技术、数字图像
处理、计算机图形学、人工智能等学科的发展,为利用计算机实现模拟人类的视觉
成为可能。在现代工业自动化生产过程中,计算机视觉正成为一种提高生产效率和
检验产品质量的关键技术之一,如机器零件的自动检测、智能机器人控制、生产线
的自动监控等;在国防和航天等领域,计算机视觉也具有较重要的意义,如运动目
标的自动跟踪与识别、自主车导航及空间机器人的视觉控制等。
人类视觉过程可以看作是一个从感觉到知觉的复杂过程,从狭义上来说视觉
的最终目的是要对场景作出对观察者有意义的解释和描述;从广义上说,是根据
周围的环境和观察者的意愿,在解释和描述的基础上做出行为规划或行为决策。
计算机视觉研究的目的使计算机具有通过二维图像信息来认知三维环境信息的能
力,这种能力不仅使机器能感知三维环境中物体的几何信息(如形状、位置、姿
态运动等),而且能进一步对它们进行描述、存储、识别与理解
,计算机视觉己
经发展起一套独立的计算理论与算法。
2.
什么是计算机双目立体视觉
双目立体视觉
(Binocular
Stereo
Vision)
是机器视觉的一种重要形式,它是基于
视差原理并利用成像设备从不同的位置获取被测物体的两幅图像,通过计算图像对
应点间的位置偏差,来获取物体三维几何信息的方法。融合两只眼睛获得的图像并
观察它们之间的差别,使我们可以获得明显的深度感,建立特征间的对应关系,将
同一空间物理点在不同图像中的映像点对应起来,这个差别,我们称作视差
(Disparity)
图像,如图
1
。