自学冈萨雷斯的《数字图像处理》中。
目录
1.什么是数字图像
1.1 一副图像可以定义为一个二位函数f(x,y),任意空间坐标(x,y)处的幅值f是图像在该点的强度(灰度)。当x,y,f为离散量时,该图像为数字图像。
1.2 数字图像由有限数量的元素组成,每个元素都有一个特定的位置与数值,该元素称为像素。
2. 光与电磁波
波长:
能量:
光是一种电磁辐射,可被人眼感知。
单色光:唯一属性是亮度,灰度级是单色光从黑到白的数值范围。
彩色光:电磁波范围为(紫色)~(红色)。其属性有频率、辐射、光通量、亮度。
①辐射:从光源流出的总能量,由瓦特(W)度量。
②光通量:观察者从光源感知的能量,由流明(lm)度量。
3. 图像的感知和获取
大多数图像都是由“照射”源和形成图像的“场景”元素对光能的反射或吸收产生的。
4. 图像的取样与量化
一副图像的坐标(x,y)是连续的,其幅度f(x,y)也是连续的,将图像数字化,即对图像函数 f 的坐标和幅度进行数字化。
4.1 取样与量化的概念
取样:对图像坐标x,y进行数字化。
量化:对图像函数幅度值进行数字化。
PS: 数字图像的质量很大程度取决于取样和量化中所用的样本数(M✖N)和离散灰度级(L)。其中M、N值必须取整数,离散灰度级数L通常取2的整数次幂:
则存储数字图像的比特数b为:
4.2 数字图像的表示 f(x,y)
a. f(x,y)函数图:x,y轴表示空间坐标,z轴表示f在(x,y)坐标的值。
b. 灰度矩阵图像:显示器上每个点的灰度与该点处的f值成比例。
c. M✖N数值矩阵
动态范围:灰度跨越的值域,即系统中最大可度量灰度与最小可检测灰度之比。(上限取决于饱和度,下限取决于噪声)
饱和度:指图像中灰度值的最大值,超过该值的灰度值将被裁剪掉。
对比度:一幅图像中最高和最低灰度级间的灰度差。
反差比:图像中最高和最低灰度级的比率。
4.3 线性索引和坐标索引
坐标索引:像素的位置由二维坐标(x,y)组成
线性索引:像素点的位置由一维的非负整数串组成,该非负整数串由像素点到坐标(0,0)的偏移量计算得到。(包括行扫描和列扫描)
4.4 空间分辨率和灰度分辨率
空间分辨率:图像中最小可辩别细节的测度,即单位距离的线对数和单位距离的点数(像素数)。
PS:空间分辨率的测度必须针对空间单位来声明。
- 采样间隔越大,所得图像像素数越少,空间分辨率低,质量差,严重时出现马赛克效应;
- 采样间隔越小,所得图像像素数越多,空间分辨率高,图像质量好,但数据量大。
灰度分辨率:图像灰度级中可分辨的最小变化。灰度分辨率通常指量化灰度时所用的比特数。
- 量化等级越多,所得图像层次越丰富,灰度分辨率高,图像质量好,但数据量大;
- 量化等级越少,图像层次欠丰富,灰度分辨率低,会出现假轮廓现象,图像质量变差,但数据量小.
4.5 图像内插
内插是用已知数据来估计未知位置的值的过程,常用于图像放大、缩小、旋转和几何校正等任务中。
最近邻内插:将图像最近邻的灰度赋给新位置。
双线性内插:使用4个最近邻的灰度来计算给定位置的灰度。
双三次内插:使用16个最近邻点的灰度计算给定位置的灰度。
图像放大中,常采用内插法填充原图像像素之间的间隙来增大图像的尺寸,可得到亚像素精度。
5. 像素间的一些基本关系
5.1 相邻像素
4邻域 :像素p左右水平2个相邻像素和上下垂直的2个相邻像素组成。
:像素p的4个对角相邻像素组成。
8邻域:像素p的四角相邻像素和4邻域组成。
PS:包含像素p的邻域为闭邻域,or为开邻域。
5.2 邻接、连通、区域、边界
1)邻接
令V是用于定义邻接性的灰度值集合,(eg:二值图像中,指值为1的像素邻接,则V={1})
PS:m邻接是为了消除8邻接的二义性而引进的。如下图中矩阵中,右上角1到右下角1,按照8邻接则有两条路,而m邻接仅1条路。
总结:判断两个像素是否邻接的条件:①两个像素位置是否相邻(4、8、m邻接);②两个像素的灰度值是否满足某个特定的相似性准则(在集合V中)。
2)连通
通路:如果从(x0,y0)像素点到(xn,yn)像素点,其中的每个点与前后都是K邻接的(K代表4、8、m),则说这两个像素之间存在一条K通路。若(x0,y0)和(xn,yn)是重合的,那么说这是一条闭合通路。
PS:K指该通路的各像素邻接类型,而n指该通路的长度。
连通:对于图像中的某一个像素子集S和S中的任意两个像素p、q,如果p和q之间有一个由S中全部元素构成的通路,则称像素p和q在S中是连通的。
(英文版原文:Two pixels p and q are said to be connected in S if there exists a path between them consisting entirely of pixels in S.)
连通分量:对于像素子集S中任意像素p,在S中连通至该像素p的像素集称为S的连通分量。
连通集:若S只有一个连通分量,则S称为连通集。
PS:什么时候会存在多个连通分量?——根据通路中各像素邻接类型K,对于S中像素p来说,不同类型的通路可能会导致连通至像素p的像素集不同,即导致不同的连通分量。
区域:若图像子集S是一个连通集,则S称为图像的一个区域。
邻接区域:两个区域联和成一个连通集,则称其为邻接区域。(讨论区域的时候,必须指定区域邻接类型:4or8邻接)
例子:
像素子集存在一个m通路,因此S中任意两个像素在S中都是连通的。在S中,有且仅有一个像素集连通至像素,故对于S中的像素来说,只有一个连通分量,故S是连通集,且S是图像的一个区域。
4)边界
一个图像含k个不相交区域,则这k个区域的并集是该图像的前景,的补集是图像的背景。
区域R的内边界:区域R中和其补集像素相邻的一组像素。
区域R的外边界:背景中对应的边界。
PS:边界和边缘的区别。一个有限区域的边界形成一个闭合通路,是一个“整体”;边缘是由其导数超过某个预设阈值的像素形成的,是一个“局部”。
eg:
1指区域的内边界是其本身,其外边界是围绕该区域的闭合通路。
5.3 距离测度
令p点坐标 (x,y) ,q点坐标 (u,v),则
欧几里得(欧式)距离:满足 的像素 形成一个中心在 、半径为的圆盘。
城市街区距离:满足像素形成一个中心为 的菱形,且的像素是的4邻域。
棋盘距离:满足像素形成一个中心为 的方形,且的像素是的8邻域。
距离:两点之间的最短通路。
PS:像素p和q之间的和距离和可能存在于这些点之间的任何通路无关,其度量仅涉及像素坐标。然而在m邻接情况下,两点之间的距离取决于沿该通路分布的像素值以及相邻像素的值。(因为m邻接下,像素值直接影响通路长度)