1、视觉感知要素
①人眼剖面简图
②锥状体与杆状体
视网膜有两类感光器:锥状体和杆状体。锥状体视觉成为白昼视觉或亮视觉。,对颜色高度敏感。而且每个锥状体都连接到神经末梢,人可以充分地分辨图像细节。 杆状体称为暗视觉或微光视觉。 它们没有色彩感觉,而对低照明度敏感。 几个杆状体才连到一个神经末梢,所以不感知事物的细节,只感知一般的总体图像。
③视网膜上杆状体与锥状体的分布
④眼睛中图像的形成
球体前端为晶状体,相当于镜头,内壁为视网膜,相当于胶片。 眼睛实现正确聚焦的焦距是通过改变晶状体的形状来得到的。这点跟相机成像不同。
⑤亮度适应和辨别
(1)下图曲线表明,在低照明级别,亮度辨别较差,且会随着背景照明的增加而明显改善。 反映了这样一个事实,在低照明水平下,视觉有杆状体执行,在高照明水平下,视觉由锥状体执行。
(2)感觉亮度:马赫带效应
马赫带1865年首先描述视觉系统倾向不同强度区域边界周围的”欠调”或”过调”,证明感觉亮度不是简单的强度函数。
(3)感觉亮度:同时对比现象
同时对比现象,所有的中心方块有同样的亮度,但当背景变亮时,感觉它们就逐渐变暗。即感知区域的亮度并不简单地取决于其强度,证明感觉亮度不是简单的强度函数。
(4)人类感知现象:视觉错觉
在视觉错觉中,眼睛填充了不存在的信息或者错误地感知了物体的几何特点。
2、光和电磁波谱
我们感受到的可见光的色彩范围只占电磁波的一小部分。光是一种特殊的电磁辐射,他可以被人眼感知。 人感知物体的颜色由物体反射光的特性决定。如果所有可见波长相对平衡的反射光,那么这个物体对观察者而言是白色。例如,绿色物体反射波长范围为500--570nm的光,而吸收其他波长的大部分能量。电磁波可以看成是以波长λ传播的正弦波,每个粒子以波的的模式以光速传播和移动。通过上面公式可以看出能量与频率成正比。这样,无线电波有低能量光子,而伽马射线的能量最高,这就是伽马射线对活体组织危害大的原因。
3、图像感知与获取
①成像原理
通过将输入电能和对特殊类型检测能源敏感的传感器材料相组合,把输入能源转变为电压。输出连续的电压波形,这些波形的幅度和空间特性都与感知的物理现象有关。
②三种主要传感器装置:单个成像传感器、条带传感器、阵列传感器
③使用单个传感器获取图像
胶片每旋转一个增量,且传感器完整地从左到右线性移动一次,输出图像的一行。
④使用条带传感器获取图像
(1)使用一个线性传感器带获取图像 (2)使用一个环形传感器带获取图像
⑤简单的图像形成模型
f(x,y)=i(x,y)●r(x,y),其中:f(x, y)是图像幅度分布,i(x, y)是入射场分布,取决于照射源特性,r(x,y)是反射系数分布,取决于成像物体的特性。
4、图像取样与量化
①基本概念
(1)图像数字化:将模拟图像经过离散化之后,得到用数字表示的图像。图像的数字化包括采样和量化两个过程。
(2)取样:是将在空间上连续的图像转换成离散的采样点(即像素)集的操作。即:空间坐标的离散化。
(3)量化:把采样后所得的各像素的灰度值从模拟量到离散量的转换称为图像灰度的量化。即:灰度的离散化。
②数字图像表示
(1)数值阵列表示
(2)矩阵表示
③空间和灰度分辨率
(1)空间分辨率:图像空间中可分辨的最小细节。一般用单位长度上采样的像素数目或单位长度上的线对数目表示。例如,举一个质量概念,报纸用75dpi的分辨率来印刷,杂志是133dpi,光鲜的小册子是175dpi,您正在看的书是以2044dpi印刷的。空间分辨率的度量必须针对空间单位来规定才有意义。
(2)灰度分辨率:图像灰度级中可分辨的最小变化。一般用灰度级或比特数表示。灰度级数通常是2的整数次幂。最通用的是8比特。通常说一副被量化为256级的图像有8比特的灰度分辨率。
(3)空间分辨率(图像的采样)与图像质量的关系:空间分辨率越高,图像质量越好;空间分辨率越低,图像质量越差,会出现棋盘模式。所谓颜色或灰度级指黑白显示器中显示像素点的亮暗差别,在彩色显示器中表现为颜色的不同,灰度级越多,图像层次越清楚逼真。灰度是相对于单色而言的,将亮度分成256恰好一个字节。
(4)空间分辨率和灰度分辨率同时变化,对图像质量的影响
等偏爱曲线(Isopreferencecurve):在N-k平面内对应于主观感觉质量相等的曲线,当图像中细节增加时,等偏爱曲线趋于更接近N-k平面内的垂直线。
图像质量一般随N和k的增加而增加。在极少数情况下对固定的N,减小k能改进质量。最有可能的原因是减小k常能可增加图像的视觉反差。对具有大量细节的图像只需很少的灰度级数就可较好地表示。N×k为常数的图像主观看起来可以有较大的差异。
④图像内插
(1)最邻近内插法
假设一副大小为500×500像素的图像要放大1.5倍到750×750像素。一种简单的放大方法是创建一个假想的750×750网格,他与原始图像有相同的间隔看,然后将其收缩,使他准确地与原图像匹配。显然,收缩后的750×750网格的像素间隔要小于源图像的像素间隔。为了对覆盖的每一个点赋以灰度值,我们在原图像中寻找最接近的像素,并把该像素值的灰度赋给750×750网格中的新像素。当我们完成对网格中覆盖的所有点的灰度值后,就把图像扩展到原来规定的大小,得到放大后的图像。
最邻近内插法简单,但是有缺陷,如某些直边缘严重失真。
(2)双线性内插
我们用4个最近邻去估计给定位置的灰度。令(x,y)为我们想要赋以灰度值的位置,并令v(x,y)表示灰度值。赋值公式由下面的公式得到的:v(x,y)=ax+by+cxy+d 其中,4个系数可由4个用(x,y)点最近邻点写出的未知方程确定。
双线性内插结果比较好,但加大了计算量。
(3)双三次内插
它包括16个最邻近点。赋予点(x,y)的灰度值是使用下式得到的:
v(x,y)=其中,16个系数可由16个用(x,y)点最近邻点写出的未知方程确定。
双三次内插是商业图像编辑程序的标准内插方法,例如Adobe Photoshop 和 CorelPhotopaint。
5、像素间的一些基本关系
①相邻像素
(1)p的4邻域
坐标为(x,y)的像素p有4个水平和垂直的相邻像素,坐标分别为: (x+1, y), (x-1, y), (x, y+1), (x, y-1),这个像素集称为p的4邻域,用N4(p)表示。
(2)p的4个对角邻像素
坐标分别为: (x+1, y+1), (x-1, y-1), (x-1, y+1), (x-1, y-1),用N D(p)表示。
(3)p的8邻域
N4(p)+ N D(p)
②邻接性
(1)4邻接:如果q在N4 (p)中,具有V中数值的两个像素p和q是4邻接的。
(2)8邻接:如果q在N8 (p)中,具有V中数值的两个像素p和q是8邻接的。
(3)m邻接:如果q在N4(p)中,或者q在ND(p)中且集合N4(p) ∩ N4(q)没有V值的像素,则具有V值的像素p和q是m邻接的。
③连通和通路
从具有坐标(x, y)的象素p到具有坐标(s, t)的象素q的一条通路由一系列具有坐标(x0, y0),(x1, y1),…,(xn, yn)的独立象素组成。这里(x0, y0) = (x, y),(xn, yn) = (s, t),且(xi, yi)与(xi-1, yi-1)邻接,其中1 ≤ i ≤ n,n为通路长度。连接是连通的一种特例,连通是由一系列依次连接的象素组成。
④距离度量
给定3个像素p, q, z,坐标分别为(x,y),(s,t),(v,w),如果下列条件满足,则D是距离度量函数:
(1) D(p,q)≥0 (D(p,q)=0 当且仅当 p=q)
(2) D(p,q) = D(q,p)
(3) D(p,z)≤D(p,q)+D(q,z);
欧氏距离:模为2的距离
根据这个距离量度,与(x,y)的距离小于或等于某个值d的象素都包括在以(x,y)为中心以d为半径的圆
城区(city-block)距离:模为1的距离,或D4距离
D4(p,q) = |x-s| + |y-t|
6、数字图像处理中所用数学工具的介绍
①阵列与矩阵操作
矩阵相乘还是以前线性代数中的相乘。 我们让阵列操作贯穿全书。 当我们谈到一副图像的求幂时,意味着每个像素均进行求幂操作;当我们谈到一幅图像除以另一幅图像时,意味着在相应的像素之间进行相除。
②线性操作与非线性操作
图像处理方法最重要的分类之一是他是线性的还是非线性的。考虑一般的算子H,该算子对于给定输入图像f(x,y)产生一副输出图像g(x,y): H[f(x,y)]=g(x,y) 如果
=+
则称H是一个线性算子
③算术操作
图像间的算术操作是阵列操作,其意思是算数操作在相应的像素对之间执行。 s(x,y)=f(x,y)+g(x,y) g(x,y)=f(x,y)-g(x,y) p(x,y)=f(x,y)×g(x,y) s(x,y)=f(x,y)÷g(x,y) 其中x=0,1,2,...M-1,y=0,1,2,...N-1。 通常,M和N是图像的行和列。 图像算术操作涉及同样大小的图像。
7、总结
本章内容主要还是为后续内容提供背景知识,其中对人眼感知图像与光和电磁波谱的讨论理解的比较好。2.6节的内容是介绍性的,初学数字图像处理概念对此读起来比较困难,还是要多读几遍去理解后再给这一节做总结。