数字图像处理(第二章)

第二章 数字图像处理基础

2.1人眼的结构

 (一般考试不会考,只是简单了解即可)

  1. 晶状体:可以依靠肌肉的收缩、扩张来控制焦距。
  2. 视网膜:成像的温床。传说中的视锥细胞和色杆细胞就是在组成视网膜的一部分。
  3. 中央凹:黄斑中央的凹陷称为中央凹,是视力最敏锐的地方,因为他在1.5mm的圆形区域中集中了视网膜中的大部分视锥细胞。
  4. 盲点:视神经集中的地方(传输信号给大脑),视锥/视杆细胞无法分布,所以光照在这个地方会是一个盲区。

眼睛中的光接收器主要是视觉细胞,它包括视锥细胞和视杆细胞。

视锥细胞(白昼视觉/亮视觉)

  • 数量:600 ~ 700万
  • 形状:锥状体细胞。
  • 作用:对颜色高度敏感,可以充分分辨图像细节。
  • 分部区域:主要在视网膜的中央凹区域,在这部分的分布密度大约为150000个/mm方。

补充:人类一般有三类视锥细胞, 分别对应三种不同颜色的感应(黄绿、绿、蓝紫),这也是RGB三原色的由来

视杆细胞(暗视觉/微光视觉)

  • 数量:7500 ~ 15000万
  • 形状:杆状体细胞。
  • 作用:分辨率较低,没有色彩感觉,不感觉颜色,对低照明敏感
  • 分部区域:分部在视网膜中心向外偏离视轴大约20°,密度先增大后减少。

2.2 亮度适应和辨别

  人的视觉系统能够适应的光强度级别范围很宽——从暗阈值到强闪光约有1010个量级。实验数据指出,主观亮度(即由人的视觉系统感知的亮度)是进入人眼的光强的对数函数。

 

        图中画出的光强度与主观亮度的关系曲线说明了这一特性。人眼视觉系统对亮度的对比度敏感而非对亮度本身敏感。 

      另外两种现象清楚地表明感知亮度不是强度的简单函数。第一种现象基于这样一个事实,即视觉系统往往会在不同强度区域的边界处出现“下冲”或“上冲”现象,即马赫带效应,厄恩斯特·马赫于1865年首次描述了这一现象。(马赫带现象要记住它的专业性描述)

       第二种现象叫同时对比,即感知区域的亮度并不简单地取决于其强度,如图所示,所有的中心方块都有完全相同地强度。然而,随着背景变得更亮,它们在眼睛里会变得更暗。

 

       人类感知现象的另一些例子就是错觉,在错觉中,眼睛填充了不存在的信息或错误地感知了物体的集合特点。如图所示,正方形的轮廓看起来很清楚,尽管图像中并没有定义这样的一个图形的直线。其它三幅图也类似。

2.2图像的数字化及表达

       图像有单色与彩色、平面与立体、静止与动态、自发光与反射(透射)等区别,任一幅图像,根据它的光强度(亮度、密度或灰度)的空间分布,均可以用下面的函数形式来表达:

(x,y,z为空间坐标,t,为时间, 为波长)

 对静态图像,t为常数,对于单色图像为常数,对于平面图像,z为常数。

则对于静态平面单色图像数学表达式为:

2.3图像的采样和量化

(1)采样(空间坐标的离散化)

将空间中连续的图像变换成离散点的操作成为采样。若横向的像素数(列数)为M ,纵向的像素数(行数)为N,则图像总像素数为M*N个像素。

采样间隔越大,所得图像像素数越少,空间分辨率低,质量差,严重时出现马赛克效应;

采样间隔越小,所得图像像素数越多,空间分辨率高,图像质量好,但数据量大。

在灰度级变化尖锐的区域,用细腻的采样,在灰度级比较平滑的区域,用粗糙的采样。

(2)量化(灰度的离散化)

图像采样后分割成离散的像素,但是其灰度值是连续的,计算机不能处理,将像素灰度转换成离散的数值的过程称为量化。

量化等级越多,所得图像层次越丰富,灰度分辨率高,图像质量好,但数据量大;

量化等级越少,图像层次欠丰富,灰度分辨率低,会出现假轮廓现象,图像质量变差,但数据量小.

 

2.4空间分辨率和灰度分辨率

空间分辨率是图像中最小可辩别细节的测度也就是数字图像的采样分辨率。在数量上,空间分辨率可以有很多方法表示。其中每单位距离线对数每单位距离点数(像素数)是最通用的度量。每单位距离点数是印刷和出版业中最常用的图像分辨率的度量。

灰度分辨率是指在灰度级中可分辨的最小变化。也就是数字图像的量化分辨率。基于硬件的考虑,正如前一节中提到的那样,灰度级数通常是2的整数次幂。最通用的数是8比特,在某些特殊的图像增强应用中,用16比特也是必要的。

2.5内插法

内插通常在图像放大、缩小、旋转和几何校正等任务中使用。

最近邻内插:将原图像中最近邻的灰度赋给了每个新位置,方法简单但是会有严重失真。

双线性内插:用到4个最近邻点,构建4个方程:v(x,y)=ax+by+cxy+d,求解出系数:a、b、c、d,代入所求位置的x、y,即可求解出该点灰度值v(x,y)。

双三次内插:包括16个最近邻点,考试一般不要求计算,所以只需知道有该内插法即可。

2.6像素间的基本关系

2.6.1邻域:

假设坐标(x,y)处的像素p有4个与其水平和垂直的相邻像素,坐标分别为:

(x+1,y)、(x-1,y)、(x,y+1)、(x,y-1)

则这组像素称为p的4邻域(自然是不包括p的),用N4(p)表示(如下图的橙色点)。每个像素距(x,y)一个单位距离,如果(x,y)位于图像的边界上,则p的某些相邻像素位于数字图像的外部。

p的4个对角相邻像素的坐标为:

(x+1,y+1)、(x+1,y-1)、(x-1,y+1)、(x-1,y-1)

并用ND(p)表示(如下图的蓝色点)。

N4(p)和ND(p)合起来称为p的8邻域,用N8(p)表示。同样,这些相邻像素点是可能落在图像外边的(如下图的第三个图,橙色和蓝色两个部分的点均为N8(p)中的点)。

以上内容可图解为:

 注:以上概念为邻域,不是像素邻接。(对于某个点是领域,对于多个像素点是像素邻接)

2.6.2邻接性、连通性、区域和边界

令V(V是一个规则,例如也可V={|A-B|<=2})是用于定义邻接性的灰度值集合(邻接性不光在于是否位于其邻接域,还在于是否符合这个灰度值集合)。在二值图像中,如果把具有1值的像素归诸于邻接像素,则V={1}。在灰度图像中,概念是一样的,但是集合V一般包含有更多的元素。

此时则有

4邻接:像素p和 q的灰度值属于集合V,像素q在N_4 (p)中。

8邻接:像素p和 q的灰度值属于集合V,像素q在N_8 (p)中。

m邻接:像素p q的灰度值属于集合V,像素q在N_4 (p)中或者像素q在ND (p)中,且集合N_4 (p)∩N_4 (q)没有来自V中数值的像素(注意是集合部分,非集合部分不算)。

      m邻接是8邻接的改进。m邻接的引入是为了消除采用8邻接时产生的二义性。例如考虑下图中V={1}的像素排列,第二张图所示产生了多重二义性8邻接,第三张图所示可以通过m邻接消除这种二义性。(也就是说如果8邻接的话,这两个邻接像素之间的通路就不具备唯一性,有两条。关于通路下面有解释。)

%通路及其长度:

从具有坐标(x,y)的像素p到具有坐标(s,t)的像素q的通路(或曲线)是特定的像素序列,其坐标为

(x0,y0)、(x1,y1)、…(xn,yn)

其中(x0,y0)=(x,y)且(xn,yn)=(s,t),且像素(xi,yi)和(xi-1,yi-1)对于1≤i≤n是邻接的。在这种情况下,n是通路的长度。如果(x0,y0)=(xn,yn),则通路是闭合通路。(由此可以看出通路是隔了不止一个点的)

然后根据几邻接来区分几通路,若是4邻接就是4通路,8邻接就是8通路,m邻接就是m通路。(那么一种通路上面肯定只有一种邻接类型)

%连通,连通分量:

令S是图像中的一个像素子集。如果S中的两个像素p和q之间存在一个通路,那么说两个像素p和q在S中是连通的。

对于S中的任何像素p,S中连通到该像素的像素集(注意不要重复)称为S的连通分量(S中存在的通路条数+单个不能与其他像素组成通路的和)。举一个更具体的例子:假设在S中有5个像素p1、p2、p3、p4、p5。然后p1-p2-p3连通、p4,p5。那么这就是三个连通分量。

如果S仅有一个连通分量,则集合S称为连通集

令R是图像中的一个像素子集。如果R是连通集,则称R为一个区域。两个区域Ri和Rj,如果它们联合形成一个连通集,则区域Ri和Rj称为邻接区域。不邻接的区域称为不邻接区域。

不过在讨论是否为邻接区域的时候,只能考虑两个区域边界的像素是否构成4邻接和8邻接,而不考虑m邻接。在定义区域邻接的时候,必须指定邻接类型(区域之间几邻接需与区域内部几邻接一致,即:如果两个邻接区域的并集需要为一个连通集则整个大区域需只能存在一种邻接)。(当然这些区域之间肯定不允许出现有交集的情况)

%前景和背景:

假设一幅图像包含有K个不相交的区域Rk,k=1,2,3…,K。且它们都不与图像边界相接(进行这种假设的目的在于方便进行图像处理。如果一个或多个区域接触到图像的边界,我们可简单地使用1像素宽的背景值边界来填充图像)。

令Ru代表所有K个区域的并集,并令(Ru)c代表其补集。我们称Ru中的所有点为图像的前景,而称(Ru)c中所有点为图像的背景

%边界:

区域R的边界(也称为边框或轮廓)是R中与R的补集中的像素相邻的一组像素。换一种方式说,一个区域的边界是该区域中至少有一个背景邻点的像素集。这里再强调一下,我们必须指定用于定义邻接的连通性(即是几连通的)。

仅当区域和背景之间采用8邻接时,加圈的点才位于像素值为1的边界上

前述定义有时称为区域的内边界,以便于其外边界相区分,外边界对应于背景边界。在开发追踪边界的算法时这一区别很重要。这种算法为了保证结果形成一个闭合通路,通常是沿外边界确立的。

       如果R恰巧是整幅图像(我们假设这幅图像是像素的方形集合),则边界由图像第一行、第一列和最后一行、最后一列的像素集合来定义。

2.7算术运算:

两幅图像f(x,y)和g(x,y)之间的算术运算表示为:

s(x,y)= f(x,y)+g(x,y)

d(x,y)= f(x,y)-g(x,y)

p(x,y)= f(x,y)*g(x,y)

v(x,y)= f(x,y)÷g(x,y)

这些运算都是对应像素运算。

应用:

图像相加(平均)降低噪声(例如:很多的星球图像相加,然后求平均值从而得出清晰的星球图像)

使用图像相减比较图像(图像相减用于增强图像的差)

使用图像相乘/相除矫正阴影和模板(比如一幅图像拍摄的时候,一个角落特别暗,其他地方特别亮,那通过计算得出阴影的模式,就可将其阴影模式的倒数乘以原图像,从而消除光线分布不均匀而对图像产生的影响。)

 

2.8空间运算

空间运算分为三类:(1)单像素运算;(2)邻域运算;(3)几何空间变换

2.8.1 单像素运算

       是用一个变换函数T改变图像中各个像素的灰度。

s=T(z)

      第3章具体讨论。

2.8.2 邻域运算

      后续章节会讨论关于算子对邻域运算处理进行讨论

2.8.3 几何变换

      改变图像中像素的空间排列,这些变换通常称为橡皮膜变换(根据预定义的一组规则来拉伸或收缩橡皮膜),数字图像的几何变换由两种基本运算组成:

  1. 坐标的空间变换;
  2. 灰度内插,即为空间变换后的像素赋灰度值

     考点主要是仿射变换,包括:缩放变换、平移变换、旋转变换和剪切变换。

      上面这个式子可以看成以下变化的通式。

      以下式子或者矩阵需要进行理解记忆,缩放和平移都很好理解,旋转的部分可以自己画坐标轴然后推导,以加深理解。

注:若考试中或者不同书本中出现式子的某些值不一样,可以考虑时不时该书籍或者是题目选取的坐标系不同,坐标系有直角坐标系(笛卡尔坐标系)和矩阵坐标系两种,下图采用的是矩阵坐标系。

 

2.9图像的分类

位图:位图是静止图像的一种。位图是通过许多像素点表示一幅图像,每个像素具有颜色属性和位置属性

       图像的分类很好理解,这里就只是简单的列出来,其中索引图像可以当成你在寻找字体的颜色时,系统已经给你设定好了就那么多颜色,只能从中选出你最心仪的一种,而没有全彩的可以自己选定R、G、B各自的值为多少。

  • 2
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值