2.1 视觉感知要素
2.2 光和电磁波谱
在波谱的一端是无线电波,其波长是可见光波长的几十亿倍。另一端是伽马设想,其波长是可见光小几百万倍。电磁波谱可用波长、频率或能量来描述。
波长(λ)和频率(v)的关系描述如下:
(2.1) λ = c / v
电磁波谱中各个分量的能量(E)的描述如下:
(2.2) E = h / v
(其中h为普朗克常数)
波长的单位是米,;频率用赫兹(Hz)表示,;
由于光子携带能量,且能量和频率成正比,因此更高频率的电磁现象会携带更多的能量。无线电波携带能量最少,伽马射线携带能量最多。
我们一般称没有颜色的光为单色光或无色光。单色光的为唯一属性是它的强度或大小。感知单色光的强度从黑色到灰色再到白色变化,所以灰度级一词常用来表示单色光的强度。所以关于从黑到白的单色光的度量值范围常称为灰度级,单色图像常称为灰度图像。
2.3 图像感知与获取
将照射能量变换为数字图像主要有三种传感器配置。
工作原理:将输入的电能和对特殊类型检测能源敏感的传感器材料组合,把输入能源转变为电压,输出电压波形是传感器的响应,通过把传感器数字化,从每一个传感器得到一个数字量。
2.3.1 单个传感器获取图像
为了使单一传感器产生二维图像,在传感器和成像区域之间必须有x方向和y方向的相对位移。
上图为一个高精度扫描仪的配置,其底片安装在一个鼓上,鼓的机械转动提供了一个维度的位移。单个传感器安装引导螺杆上,它提供了与转动相垂直方向上的移动。
另一种机器配置是使用一个平面床,传感器在两个方向线性移动。
器械数字化仪有时也被称为微密度计。
2.3.2 使用条带传感器获取图像
该传感器带在一个方向上提供成像单元,垂直于传感器带的运动在另一个方向上成像。(大多数平板扫描仪的排列方式)
圆环形安装的传感器带用于医学和工业成像,以得到三维物体的剖面图像。
2.3.3 使用传感器阵列获取图像
大量的电磁波和一些超声波传感装置常以阵列形式排列,是数字摄像机中所看到的主要排列方式。
2.3.4 简单的图像形成模型
对于像素f(x,y)可有两个分量来表征:
(1)入射到被观察场景的光源照射总量–也即入射分量用i(x,y)表示
(2)场景中物体所反射的光照总量–反射分量用r(x,y)表示
乘积合并形成f(x,y):
(2.3) f(x , y) = i(x , y)r(x , y)
其中 0 < i(x , y) < ∞,0 < r(x , y) < 1
注意:若出现了照射光源透过一个媒体形成图像的情况时,用透射系数代替反射系数
我们一般把一个点的亮度设置在[lmin,lmax]中,实际上这一区间一般为[0,1],0表示黑色,1表示白色,所有的中间值表示从黑色变化到白色的色调。
2.4 图像取样和量化
为了产生一副数字图像,需要把连续的感知数据转换为数字形式,这种转换包括两种处理:取样和量化。
2.4.1 取样和量化的基本概念
一副图像的x和y坐标几幅度可能都是连续的,为了将它转换为数字形式,必须在坐标上和幅度上都进行取样操作,其中对坐标值进行数字化称为取样,对幅值数字化称为量化。
c为a中线段AB的取样,并对灰度值量化。
2.4.2 数字图像表示
有三种表示方法表示f(x , y):
1.函数图,用两个坐标轴决定空间位置,第三个坐标时两个控件变量x,y为函数的f(灰度)值。
2.出现在监视器或照片上的情况,每个点的灰度与该点处的f值成正比。
3.将f(x , y)的数值简单地显示为一个阵列(矩阵)。
数值阵列常用于处理和算法开发,以公式形式,可以将一个M*N的数值阵列表示为
或
显然,aij = f(x = i , y = j) = f(i , j),所以上面两式是相同的矩阵。
在数字化的过程中,要求M、N和离散灰度值L,其中M和N均为正整数,处于硬件的考虑,一般灰度级典型地取2的整数次幂
(2.4) L = 2k
假设离散灰度级是等间隔的,且它们是区间[0 , L-1]内的整数,有时由灰度跨越的值域非正式地称为动态范围,在这里我们将动态范围定义为系统中最大可度量灰度与最小可检测灰度之比。其上限取决于饱和度,下限取决于噪声。
反差比定义为两个量的比率。
对比度定义为一幅图像中最高和最低级间的灰度差为对比度。(当一幅图像中像素可感知的数值有高的动态范围时,我们认为该图像具有高的对比度;相反具有低动态范围的图像就很呆滞)
存储数字图像所需比特数b为:
(2.5) b = M × N × k
当M = N 时 (2.6) b = N2k
2.4.3 线性索引和坐标索引
我们把像素的位置由其二维坐标给出的约定称为坐标索引或下标索引,而编程中广为使用的是线性索引,它包含两种,一种是基于图像的行扫描,一种是基于图像的列扫描。
其生成公式也很简单,通过观察即可确定,对于任何坐标对(x , y)对应的线性索引值是
(2.7) a = My + x
相反给定线性索引值a的坐标索引可由下面公式求出x,y
(2.8) x = a mod M
(2.9) y = (a - x) / M
2.4.4 空间分辨率和灰度分辨率
空间分辨率通常是通过每单位距离线对数和每单位距离点数(像素数)来度量的,其中线宽为W个单位(W可以小于1),线对的宽度就是2W,每个单位距离有1/2W个线对。它的测量必须很对空间单位来声明才有意义,图像大小本身并不含有空间分辨率信息,只有通过比较,空间分辨率才有意义。
灰度分辨率是指灰度级中可分辨的最小变化。
降低图像空间分辨率,在同等条件下, dpi数越小,图像越模糊。
改变数字图像中灰度级的典型效果,假设灰度级为256,比特数为8的图像,在保证像素不变的情况下,降低比特数。256、128、64在视觉上相差不大,但32级灰度图中,在恒定或接近恒度灰度区域处内有一组不易察觉的细小山脊状结构,这种效果是由数字图像的平滑区域中的灰度级数不足引起的,称为伪轮廓。通常在16或更少级数的均匀设置的灰度级显示中十分明显。
记灰度级为N,比特数为k
观察图片有,妇女脸庞图像时包含较少细节的一副有代表性的图像,摄像师图像包含了中等程度的细节,人群图像相比之下包含有大量的细节。
综上:曲线向右上方移动意味着更大的N和k值,意味着更好的图像质量。对大量细节的图像可能只需要较少的灰度级。当k的值减小时倾向于对比度的明显增加,此时人们通常感受到图像质量得到了改善的视觉效果。
2.4.5 图像内插
内插是用已知数据来估计未知位置的值的过程。
1.最近邻内插法
- 优点:简单。
- 缺点:会产生人们不想要的人为失真,如严重的直边失真。
2.双线性内插法
- 公式:v(x , y) = ax + by + cxy +d
- 优点:比最近邻内插法的结果好很多
- 缺点:计算量增大
3.双三次内插法
- 公式:v(x , y) = ∑ i = 0 3 ∑ j = 0 3 a i j x i y j \sum_{i=0}^{3} \sum_{j=0}^{3}a_{ij}x\raisebox{0.5em}{i}y\raisebox{0.5em}{j} i=0∑3j=0∑3aijxiyj
- 优点:在保留细节方面强于双线性内插
- 缺点:计算量更大
- ※在商用图像编辑程序中是常使用的标准内插方法。
综上:虽然图像是用整数坐标来显示的,但在处理期间采用内插法填充原图像中像素之间的间隙来增大图像的尺寸,可以得到亚像素图像。
图像缩小和放大的内插方法的比较:双三次内插>双线性内插>最近邻内插,并且存在使用样条和小波的复杂技术,采用这些技术可以得到更好的结果,对三维图像而言,在生成图像的过程中保留细节非常重要,通用数字图像处理通常不需要额外的计算开销,因此常使用双线性内插和双三次内插。
2.5 像素间的一些基本关系
2.5.1 像素的相邻像素
设坐标为(x , y)的像素p有2个水平的相邻像素和2个垂直的相邻像素,坐标分别为(x+1 , y),(x-1 , y),(x , y+1),(x , y-1)这组像素称为p的4邻域用N4( p )表示。
p的4个对角相邻像素的坐标是(x-1 , y-1),(x-1 , y+1),(x+1 , y-1),(x+1 , y+1)用ND( p )表示。这些相邻像素和4邻域合称p的8邻域,用N8( p )表示。点p的相邻图像位置集称为p的邻域。如果一个邻域包含p,那么称该邻域为闭邻域,否则为开邻域。
※上下左右为邻域,斜上斜下为对角相邻,合称8邻域。
2.5.2 邻接、连通、区域和边界
三种邻接:
1.4邻接,(上下左右),q在集合N4( p )中时,值在V中的两个像素p和q是4邻接。
2.8邻接,(上下左右,斜上斜下),q在集合N8( p )中时,值在V中的两个像素p和q是8邻接。
3.m邻接(混合邻接)
- q在N4( p )中或,
- q在ND( p )中,且集合N4( p )∩N4( p )中没有值在V中的像素,那么值在V中的两个像素p和q是m邻接的。
- ※m邻接(混合邻接)是8邻接的改进,目的是消除采用8邻接是可能导致的歧义性。
关于这块具体细节和判断详见链接
令S表示图像中像素的一个子集,如果完全由S中所有像素组成的两个像素p和q之间存在一个通路,那么称p和q是S中的连通的。对于S中的任何像素p,在S中连通到该像素的像素集称为S的连通分量。若S仅有一个连通分量,则集合S称为连通集。
令R表示图像中像素的一个子集。若R是一个连通集,则称R为图像的一个区域。两个区域Ri和Rj联合形成一个连通集时,称Ri和Rj为邻接区域,不邻接的区域称为不相交区域。
假设一幅图像有K个不相交的区域,并且他们都不与图像的边界相接。令Ru表死所有K个区域的并集,也称为所有点的图像的前景;(Ru)c表示其补集,也称所有点的图像的背景。
区域R的边界,是R中与R的补集中的像素像素相邻的一组像素,也称为内边界。外边界是背景中的对应边界,在开发跟踪算法时,这个内外边界的区别很重要!但边界和边缘是两个不同的概念,具体如:
- 一个有限区域的边界形成一个闭合通路,是整体概念
- 边缘是由其导数超过某个预设阀值的像素形成的,是边缘的一个局部概念,以一点处灰度级不连续的测度为基础。
- 但在二值图像中有例外,边界和边缘可以吻合。
2.5.3 距离测度
对于坐标分别为(x , y),(u , v)和(w , z)的像素p,q和s若
- D(p , q) ≥ 0 [D(p , q) = 0 ,当且仅当p = q],
- D(p , q) = D(q , p)且
- D(p , s) ≤ D(p , q) + D(q , s),
- 则D是一个距离函数或距离测度
(2.10) De(p , q) = [(x-u)2 + (y-