数字图像处理(第三版)学习笔记第二章


一、视觉感知要素

数字图像处理领域建立在数学和概率公式表示的基础之上,人的直观和分析起到了核心的作用。

1.人眼的结构

眼睛的形状是一个球体,有三层薄膜包裹着它,分别为角膜与巩膜外壳、脉络膜和视网膜。有两类光感受器为锥状体和杆状体。
锥状体:对颜色高度敏感,其视觉被称为白昼视觉或亮视觉。
杆状体:没有彩色感觉,对低照明度敏感,其视觉被称为暗视觉或微光视觉。

2.亮度的适应和辨别

主观亮度是由人的视觉系统感知的亮度,它是进入人眼的光强的对数函数。下图为光强度与主观亮度的关系图。
主观亮度
亮度适应现象:即通过改变其整个灵敏度来完成这一变动。
亮度适应级别:对于给定的条件集合,视觉系统当前的灵敏度级别。
韦伯比:定义两个参数分别为强度I和照射分量ΔI,其中I/ΔI即为韦伯比;其值较小表示亮度辨别能力较好,其值较大表示亮度辨别能力较差。
感知亮度不是一个简单的强度函数通过两种现象来说明,第一种是视觉系统会在不同强度区域出现“下冲”或者“上冲”现象(例下图);在靠近边界的地方感知到了带有毛边的亮度模式。
在这里插入图片描述

在这里插入图片描述
第二种现象就是同时对比和错觉

二、光和电磁波谱

电磁波谱图如下图所示

在这里插入图片描述

电磁波谱可以使用波长、频率或能量来表示。波长(λ)和频率(v)的关系如下公式:
λ=c/v (c为光速)

电磁波谱的各个分量的能量由下公式计算得出:
E=hv (h为普朗克常数)

光是一种特殊的电磁辐射,可以被人眼感知。人感受一个物体的颜色由物体反射光的性质决定的。没有颜色的光被叫做无色光或者单色光,其唯一属性是它的强度或者大小,使用灰度级来表示单色光的强度。单色图像通常被叫做灰度图像。
灰度级:从黑到白的单色光的度量值范围。

彩色光,使用发光强度、光通量、亮度来衡量。使用瓦特(W)来度量发光强度,使用流明数(lm)度量光通量,亮度体现了强度的无色概念。
发光强度:从光源流出能量的总量。

成像主要以电磁波发射的能量为基础

三、 图像感知和获取

图像多是由“照射”源和形成图像的“场景”元素对光能的反射和吸收产生的

1.单个传感器获取图像

下图为单个传感器产生图像的示例图,其通过运动来生成二维图像。还有另一类装置叫做微密度计,其使用一个平面床,传感器在两侧线性移动。
在这里插入图片描述

2.条带传感器获取图像

传感器带由内嵌传感器形式组成,它会在一个方向上提供成像单元,其排列方式如下图所示。内嵌传感器多用于航空成像,以圆环形安装的传感器多用于医学和工业成像。
在这里插入图片描述

3.传感器阵列获取图像

下图为以二维阵列形式排列的单独的传感器。大部分电磁波传感器和小部分的超声波传感器以阵列的形式排布。主要优点在于通过将能量聚焦到阵列表面以获得完整的图像。
在这里插入图片描述

4.图像成像模型

如前文所讲,图像是以f(x,y)来表示的,其中f(x,y)需要是非零的、有限的。即:

0 < f(x,y)< ∞

f(x,y)可以使用两个分量来表示:
(1)入射到被观察场景的光源照射总量
(2)场景中物体所反射的光照总量
分别被称为入射分量和反射分量,使用i(x,y)和r(x,y)来表示,而f(x,y)就是尤其合成形成的,其表达式如下:

f(x,y)= i(x,y) * r(x,y)
0 < i(x,y)< ∞
0 < r(x,y)< 1 (0表示全吸收,1表示全反射)

i(x,y)的性质取决于照射源,r(x,y)取决于成像物体的特性

四、 图像取样和量化

1.基本概念

在这里插入图片描述

取样:对坐标值进行数字化
量化:对幅值进行数字化

下图中前一张为投影到一个阵列传感器上的图像,后一个为取样和量化完之后的图像
在这里插入图片描述

2.数字图像表示

通过取样和量化可以把一幅图像转化为数字图像,有三种方法可以来表示数字图像f(x,y)。第一张图是函数图像,其中的两个坐标轴来表示其空间位置,另一个坐标轴是以空间变量x,y为函数的灰度值;第二张图像是更一般的表示,显示的是f(x,y)在监视器或者照片上的情况;第三张将其数值表示为一个阵列(矩阵)。
在这里插入图片描述
在三种表达方式中,第二、三种是最有用的。第二种可以更方便的观察结果,第三种可以更好的用于处理和算法开发。其中数字阵列表示如下所示:
在这里插入图片描述
其中的每一个元素叫做图像单元、图像元素或者像素。

可以使用数学术语来表示取样和量化过程
让Z为整数集R为实数集。取样就是把xy平面划分为一个个网格的过程,其中的每一个元素是笛卡尔积Z2中的一对元素,Z2是所有有序元素对( z i z_i zi z j z_j zj)的集合。量化过程就是把灰度值赋给每个特定坐标对(x,y)的一个函数。

数字化的过程要求对M值、N值和离散灰度级数L做出判定。灰度级数取2的整数次幂,即: L = 2k

动态范围指的是灰度跨越的值域,其上限取决于饱和度,下限取决于噪声。相联系的由对比度,即一幅图像中最高和最低灰度级间的灰度差。

存储数字图像所需要的比特数为:

b = M * N * k

下表为N和k取值时需要用来存储方形图像的比特数。当一个图像有2k个灰度级时,称其为“k比特图像”。
在这里插入图片描述

3. 空间和灰度分辨率

空间分辨率是图像中可辩别的最小细节的度量,最通用的度量是每单位距离线对数和每单位距离点数(像素数)。其度量必须针对空间单位来规定才有意义。
图像分辨率是每单位距离可分辨的最大线对数,可以使用每英寸点数(dpi)表示。
灰度分辨率是灰度级中可分辨的最小变化,通常为2的整数次幂。
对于有大量细节的图像只需要较少的灰度级,可能原因是k的减小倾向于对比度的增加。

4.图像内插

内插是在放大、收缩、旋转和几何校正等任务中使用的基本工具,它是最基本的图像重取样方法。其就是使用已知数据来估计未知位置的数值的处理。其方法有:
1.最近邻内插法,就是把原图像最近邻的灰度赋给每个新位置。会产生不希望的人为缺陷的倾向如直边缘的严重失真。
2.双线性内插法,用4个最近邻估计给定位置的灰度。假设(x,y)是需要赋值的位置坐标,另v(x,y)表示灰度值,则其公式如下:

v(x,y)= ax + by + cxy + d

a,b,c,d四个系数可以有4个最近邻得到。
3.双三次内插,包括16个最近邻点,在保持细节方面优于双线性内插,赋予的灰度值采用如下公式:

v ( x , y ) = ∑ i = 0 3 ∑ j = 0 3   a i j x i y j v(x,y)= \sum_{i=0}^3\sum_{j=0}^3\ {a_{ij}}x^iy^j vxy=i=03j=03 aijxiyj

五、 像素间的基本关系

1. 相邻像素

在坐标(x,y)的像素p有4个水平和垂直的相邻像素,如(x + 1, y),(x - 1, y),(x, y + 1),(x, y - 1)叫做p的4邻域,用 N 4 ( p ) N_4(p) N4(p)表示。p的4个对角相邻像素为(x + 1, y + 1),(x + 1, y - 1),(x - 1, y + 1),(x - 1, y - 1),使用 N D ( p ) N_D(p) ND(p)表示。全部称为p的8邻域,用 N 8 ( p ) N_8(p) N8(p)来表示。

2. 邻接性、连通性、区域和边界

假设V为定义邻接性的灰度值的集合。在二值图像中,1值像素叫做邻接像素即V={1},灰度图像中V的值更多。一共有三种类型的邻接,分别为4邻接,8邻接和m邻接(混合邻接)。混合邻接是为了消除8邻接是产生的二义性。

假设S为图像中的一个像素子集,若S中所有像素间存在通路,则是连通的。其中S中连通到该像素的像素集叫做连通分量,假如只有一个连通分量则称集合S为连通集。

假设R为图像中的一个像素子集,如果R为连通集则称其为一个区域。如果两个区域可以联合形成一个连通集则两个区域为邻接区域。

假设一幅图像包含K个不相邻的区域,即 R k R_k Rk,则图像的前景为 R u R_u Ru(K个区域的并集),图像的背景为 ( R u ) c (R_u)^c (Ru)c(其补集)。区域的边界(内边界)是该区域中至少一个背景邻点的像素集合。

3. 距离度量

对于(x,y),(s,t),(v,w)的像素p,q,z。假若
1. D ( p , q ) ≥ 0 [ D ( p , q ) = 0 , 当且仅当 p = q ] D(p,q)≥0[D(p,q)=0,当且仅当p=q] D(p,q)0[D(p,q)=0,当且仅当p=q]
2. D ( p , q ) = D ( q , p ) D(p,q)=D(q,p) D(p,q)=D(q,p) D ( p , z ) ≤ D ( p , q ) + D ( q , z ) D(p,z)≤D(p,q)+D(q,z) D(p,z)D(p,q)+D(q,z)
那么D就是距离函数或者度量。据点(x,y)的距离小于或等于某个值r的像素会形成一个中点在(x,y)且半径为r的圆,p和q的欧几里得距离为:
D e ( p , q ) = [ ( x − s ) 2 + ( y − t ) 2 ] 1 / 2 D_e(p,q)=[(x-s)^2+(y-t)^2]^{1/2} De(p,q)=[(xs)2+(yt)2]1/2
据点(x,y)的距离 D 4 D_4 D4小于或等于某个值r的像素会形成一个中点在(x,y)的菱形,如下图,p和q间的距离 D 4 D_4 D4(城市街区距离)定义为:
D 4 ( p , q ) = ∣ x − s ∣ + ∣ y − t ∣ D_4(p,q)=|x-s|+|y-t| D4(p,q)=xs+yt
在这里插入图片描述
据点(x,y)的 D 8 D_8 D8距离小于或等于某个值r的像素会形成一个中点在(x,y)的菱形,如下图。棋盘距离为p和q之间的 D 8 D_8 D8距离定义为:
D 8 ( p , q ) = m a x ( ∣ x − s ∣ , ∣ y − t ∣ ) D_8(p,q)=max(|x-s|,|y-t|) D8(p,q)=max(xs,yt)
在这里插入图片描述

六、所用工具

主要为了
1.介绍本书中将使用到的数学工具
2.帮助建立如何使用这些工具的感觉

主要有阵列和矩阵操作(以逐像素为基础执行)、线性操作和非线性操作、算术操作(在像素对之间执行,有加减乘除)、集合和逻辑操作、空间操作、向量和矩阵操作、图像变换、概率方法。

1.线性操作和非线性操作

线性算子,如果
H [ a i f i ( x , y ) + a j f j ( x , y ) ] = a i H [ f i ( x , y ) ] + a j H [ f j ( x , y ) ] = a i g i ( x , y ) + a j g j ( x , y ) H[a_if_i(x,y)+a_jf_j(x,y)]=a_iH[f_i(x,y)]+a_jH[f_j(x,y)]=a_ig_i(x,y)+a_jg_j(x,y) H[aifi(x,y)+ajfj(x,y)]=aiH[fi(x,y)]+ajH[fj(x,y)]=aigi(x,y)+ajgj(x,y)
那么H就是一个线性因子。
加性:两个输入的和与分别对输入进行操作然后再求和得到的结果相同
同质性:输入乘以常数的线性操作的输出与乘以该常数的原始输入的操作的输出相同

2.集合和逻辑操作

一共有基本集合操作、逻辑操作(广泛引用于图像形态学处理)和模糊集合。
灰度值的并集操作和交集操作定义为相应像素对的最大和最小,补集操作定义为常数与图像中每个像素的灰度间的两两差值。

3.空间操作

有单像素操作、邻域操作和几何空间变换三大类。其中单像素操作就是以灰度为基础改变单个像素的值;
领域操作:令 S x y S_{xy} Sxy代表图像f中任意一点(x,y)为中心的一个邻域的坐标集,在输出图像g中相同坐标处生成相应的像素,其值在 S x y S_{xy} Sxy内决定,可以描述为:
g ( x , y ) = 1 m n ∑ ( r , c ) ∈ S x y f ( r , c ) g(x,y)=\frac{1}{mn}\sum_{(r,c)∈S_{xy}} f(r,c) g(x,y)=mn1(r,c)Sxyf(r,c)
r和c为行和列坐标。
几何变换可以改变像素间的空间关系,叫做橡皮膜变换。其组成有坐标空间变换和灰度内插。下表为实现变换的矩阵值。
在这里插入图片描述
有前向映射和后向映射两种方法来实现仿射变换。

4.图像变换

方法有傅里叶变换、沃尔什变换、哈达玛变换、离散余弦变换、哈尔变换和斜变换等。

总结

以上主要讲述了后面所需要讲解内容的背景知识,大部分为后续所需要使用到的一些基本的概念,比如图像的取样和量化的方法。大部分都是理论知识的讲解,有涉及到一些基本公式的使用但大多都比较简单。其次还了解到了图像的构成以及如何对图像进行操作。

  • 12
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值