2.图像采集

本文介绍了视觉过程,包括光学过程、化学过程和神经处理过程。光学过程涉及眼睛如何作为光学设备工作;化学过程讨论了视网膜上的光接收细胞如何转化为视觉图案;神经处理过程讲述了信息如何在大脑中转化为对景物的知觉。此外,还提到了成像几何、光度学和光度视觉的相关概念。
摘要由CSDN通过智能技术生成

2.1 视觉过程
视觉过程由光学过程、化学过程和神经处理过程三个过程构成。
1.光学过程
人的眼睛是人类视觉系统的重要组成部分,是实现光学过程的物理基础。
眼睛可以视为一个直径20mm的球体,球体前端有一个晶状体(lens),对应于照相机的镜头,而晶状体前端的瞳孔(pupil)对应照相机的光圈。球体内壁有一层视网膜(retina),它是含有光感受器和神经组织网络的薄膜,对应照相机的胶片。

物体如何在眼睛上成像
2.化学过程
视网膜的表面分布着一个个光接收细胞,他们可接受光的能量并形成视觉图案。光接收细胞有两类:锥细胞(cone)和柱细胞(rod)。每个眼里有6 000 000~7 000 000个锥细胞,它们对颜色很敏感。每个细胞各自连到他自己的神经末梢。锥细胞视觉称为适亮视觉(photopic vision);柱细胞比锥细胞多很多,在视网膜上大约有75 000 000~150 000 000个柱细胞。它们分布面大但分辨率低,这是因为几个柱细胞对应一个神经末梢。柱细胞仅在非常暗的光线下工作,并对低照度敏感。柱细胞主要提供视野的整体视像,因为只有一种,柱细胞不感受颜色。例如在月光下彩色的物体看起来是无色的,因为月光下只有柱细胞在工作。这叫做适暗视觉(scotopic vision)。
视网膜中心称为中心凹(fovea),是眼睛内对光最敏锐的区域。锥细胞在中心凹区域的密度很高。
在视网膜中,视网膜将光学图像通过化学反应转换成其他形式的信息。
3.神经处理过程
神经处理过程是一个在大脑神经系统里进行的转换过程。每个视网膜接收单元都与一个神经元细胞借助突触(synapse)相连。每个神经元借助其他突触再与其它细胞相连,从而构成光神经(optical nerve)网络。光神经进一步到达大脑中的侧区域连接,并到达大脑中的纹路皮层(striated cortex)。在那里,对光刺激产生的相应通过一系列处理最终形成关于场景的表象,从而将对光的感觉转化为对景物的知觉。
2.2 成像中的空间关系
2.2.1 成像几何
1. 投影变换
假设摄像机坐标系统xyz中的各坐标轴分别与世界坐标系统XYZ中的各坐标轴平行。
镜头中心坐标是 (0,0,λ)
(X,Y,Z) 是3-D空间中任意点W的世界坐标。假设 Z>λ ,即所有客观场景中感兴趣的点都在镜头的前面。
首先建立点 W(X,Y,Z) 与其投影到图像平面的坐标间的联系,获得如下公式:

xλ=XZλ=XλZ

yλ=YZλ=YλZ

式中X和Y前面的负号代表着图像点反转。可得到3-D点投影后的图像平面坐标:
x=λXλZ

y=λYλZ

上述投影变换将3-D空间的线段投影为图像平面的线段。
3-D空间的矩形投影到图像平面后可能为任意四边形,由4个顶点所确定。因此,常有人将投影变换称为4-点映射(four-point mapping)
2.齐次坐标
平面上的直线可用 ax+by+c=0 来表示,因此一条直线也可以用矢量 l⃗ =[a,b,c]T 来表示。
对一条直线 l⃗ =[a,b,c]T ,当且仅当 ax+by+c=0 时点 x⃗ =[x,y]T 在这条直线上。用内积形式表示的话就是 [x,y,1][a,b,c]T=[x,y,1]l⃗ =0 。我们同样用齐次矢量的方式来表示点,任意一个表达点的齐次矢量的形式在表达点 [x1x2,x2x3]Tx⃗ =[x1,x2,x3]T
空间一个点的笛卡尔坐标XYZ的齐次坐标定义为 (kX,kY,kZ,k) ,其中k是一个任意的非零常数。很明显将齐次坐标变会笛卡尔坐标可用第4个坐标量去除前3个坐标量得到。这样一个笛卡尔世界坐标系统中的点可用矢量形式表示为:
w⃗ =[XYZ]T

其对应的齐次坐标可表示为:
wb=[kXkYkZk]T

若定义投影变换矩阵为:
P=10000100
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值