2.1 视觉过程
视觉过程由光学过程、化学过程和神经处理过程三个过程构成。
1.光学过程
人的眼睛是人类视觉系统的重要组成部分,是实现光学过程的物理基础。
眼睛可以视为一个直径20mm的球体,球体前端有一个晶状体(lens),对应于照相机的镜头,而晶状体前端的瞳孔(pupil)对应照相机的光圈。球体内壁有一层视网膜(retina),它是含有光感受器和神经组织网络的薄膜,对应照相机的胶片。
2.化学过程
视网膜的表面分布着一个个光接收细胞,他们可接受光的能量并形成视觉图案。光接收细胞有两类:锥细胞(cone)和柱细胞(rod)。每个眼里有6 000 000~7 000 000个锥细胞,它们对颜色很敏感。每个细胞各自连到他自己的神经末梢。锥细胞视觉称为适亮视觉(photopic vision);柱细胞比锥细胞多很多,在视网膜上大约有75 000 000~150 000 000个柱细胞。它们分布面大但分辨率低,这是因为几个柱细胞对应一个神经末梢。柱细胞仅在非常暗的光线下工作,并对低照度敏感。柱细胞主要提供视野的整体视像,因为只有一种,柱细胞不感受颜色。例如在月光下彩色的物体看起来是无色的,因为月光下只有柱细胞在工作。这叫做适暗视觉(scotopic vision)。
视网膜中心称为中心凹(fovea),是眼睛内对光最敏锐的区域。锥细胞在中心凹区域的密度很高。
在视网膜中,视网膜将光学图像通过化学反应转换成其他形式的信息。
3.神经处理过程
神经处理过程是一个在大脑神经系统里进行的转换过程。每个视网膜接收单元都与一个神经元细胞借助突触(synapse)相连。每个神经元借助其他突触再与其它细胞相连,从而构成光神经(optical nerve)网络。光神经进一步到达大脑中的侧区域连接,并到达大脑中的纹路皮层(striated cortex)。在那里,对光刺激产生的相应通过一系列处理最终形成关于场景的表象,从而将对光的感觉转化为对景物的知觉。
2.2 成像中的空间关系
2.2.1 成像几何
1. 投影变换
假设摄像机坐标系统xyz中的各坐标轴分别与世界坐标系统XYZ中的各坐标轴平行。
镜头中心坐标是 (0,0,λ)
设 (X,Y,Z) 是3-D空间中任意点W的世界坐标。假设 Z>λ ,即所有客观场景中感兴趣的点都在镜头的前面。
首先建立点 W(X,Y,Z) 与其投影到图像平面的坐标间的联系,获得如下公式:
式中X和Y前面的负号代表着图像点反转。可得到3-D点投影后的图像平面坐标:
上述投影变换将3-D空间的线段投影为图像平面的线段。
3-D空间的矩形投影到图像平面后可能为任意四边形,由4个顶点所确定。因此,常有人将投影变换称为4-点映射(four-point mapping)
2.齐次坐标
平面上的直线可用 ax+by+c=0 来表示,因此一条直线也可以用矢量 l⃗ =[a,b,c]T 来表示。
对一条直线 l⃗ =[a,b,c]T ,当且仅当 ax+by+c=0 时点 x⃗ =[x,y]T 在这条直线上。用内积形式表示的话就是 [x,y,1]⋅[a,b,c]T=[x,y,1]⋅l⃗ =0 。我们同样用齐次矢量的方式来表示点,任意一个表达点的齐次矢量的形式在表达点 [x1x2,x2x3]T的时候都是x⃗ =[x1,x2,x3]T 。
空间一个点的笛卡尔坐标XYZ的齐次坐标定义为 (kX,kY,kZ,k) ,其中k是一个任意的非零常数。很明显将齐次坐标变会笛卡尔坐标可用第4个坐标量去除前3个坐标量得到。这样一个笛卡尔世界坐标系统中的点可用矢量形式表示为:
其对应的齐次坐标可表示为:
若定义投影变换矩阵为: