一、人眼结构
眼睛由三层膜包裹:角膜与巩膜外壳、脉络膜和视网膜。
- 角膜是一种硬而透明的组织,覆盖着眼睛的前表面,巩膜是一层包围眼球其余部分的不透明膜。
- 脉络膜包含血管网,是眼睛的重要滋养源。
- 视网膜是眼睛最里面的膜。眼睛适当聚焦时,来自眼睛外部物体的光在视网膜上成像。感受器通过感受视网膜表面分布的不连续光形成图案。
光感受器分为:锥状体和杆状体。
每只眼睛中的锥状体数量约为600~700万个,对颜色高度敏感。使用锥状体人可以充分分辨图像细节(每个锥状体都连接到自身的神经末梢)。锥状体视觉称为白昼视觉或亮视觉。
约有7500~15000万个杆状体分布在视网膜表面。用来给出视野内的总体图像。没有色彩感觉,对低照明度敏感。杆状体视觉称为暗视觉或微光视觉。
二、电磁波谱和光
2.1 电磁波谱
电磁波谱可用波长(λ)、频率(v)或能量(E)来描述
λ = c/v
c为光速。电磁波谱的各个分量的能量如下:
E = hv
h是普朗克常量。
频率越高,波长越短的电磁波能量越大。
2.2 光
光是一种特殊的电磁辐射,可被人眼感知。电磁波谱可见光波段分为6个主要区域:紫色、蓝色、绿色、黄色、橘黄色和红色。每种颜色不是突然终止的,而是混合平滑地过渡到另一种颜色的。
人感受到的物体颜色由物体反射的光的性质决定。白色物体,以所有反射的可见光波长均衡;带色物体,物体吸收了其他波长的大部分能量,从而反射某段波长范围的光。
单色光或无色光,没有颜色。唯一属性是强度或大小。常用灰度级表示单色光的强度。从黑到白的单色光的度量值范围通常称为灰度级,单色图像称为灰度图像。
描述彩色光源质量的基本量:发光强度、光通量和亮度。
- 发光强度:光源流出的能量总量,用瓦特度量
- 光通量:观察者从光源感受到的能量。用流明数度量
- 亮度:光感知的主观描绘子,实际不能度量
三、图像的数学模型
f(x,y) = i(x,y)r(x,y)
其中 0<i(x,y)<∞ ,0(全吸收)<r(x,y)<1(全反射)
i(x,y):入射分量。入射到被观察场景的光源照射总量
r(x,y):反射分量。场景中物体所反射的光照总量
令单色图像的任何坐标(x0,y0)处的强度表示为 l= f(x0,y0)
l的取值范围为[Lmin,Lmax]。
区间[Lmin,Lmax]为灰度级。实际情况下常令该区间为[0,L-1],其中l = 0为黑色,l = L-1为白色。
灰度级一般为2的整数次幂。L = 2^k
四、图像的取样和量化
4.1 取样和量化的概念
取样:空间坐标的离散化
量化:灰度离散化
数字图像的质量在很大程度上取决于取样和量化中所用的样本数和灰度级。
4.2 数字图像表示
图像在任何坐标(x,y)处的值记为f(x,y),其中x和y都是整数。
将图像用数值阵列(M*N)的形式表示
右边是一个实数矩阵,矩阵中的每个元素称为像素。
在某些讨论中,用传统矩阵表示数字图像及像素更方便:
标准右手笛卡尔坐标系:数字图像的原点位于左上角,正x轴向下延伸,正y轴向右延伸。
图像系统的动态范围:系统中最大可度量灰度与最小可检测灰度之比。基本上动态范围由系统能表示的最低和最高灰度级来确定。
对比度:一幅图像中最高和最低灰度级间的灰度差。
存储数字图像所需的比特数为:b = MxN*k
4.3 空间和灰度分辨率
空间分辨率(取样):图像中可辨别的最小细节的度量。
空间分辨率的度量必须针对空间单位来规定才有意义。
灰度分辨率(量化):灰度级中可分辨的最小变化,一般用灰度级或比特数表示。最通用的数是8比特。
图像分辨率表示的是能看到图像细节的多少,依赖于MxN和L
保持MxN不变而减少L则会导致伪轮廓
保持L不变而减少MxN则会导致棋盘格。
空