文章目录
1 数字图像与数字图像处理
1.1 基本概念
图:是物体反射或者透射电磁波的分布
像:是人的视觉系统对接收的图信息在大脑中形成的印象
图像:是“图”和“像”的结合,具体来说,就是用各种观测系统以不同的形式和手段观测客观世界而获得的、可以直接或间接作用于人的视觉系统而产生的视知觉实体。
数字图像:一幅图像可以定义为一个二维函数f(x,y),其中x和y是空间(平面)坐标,任意一对空间坐标(x,y)处的幅值f称为图像在该点的强度或灰度。当x,y和灰度值f都是有限的离散量时,我们称该图像为数字图像。
上图图像是由有限数量的元素组成,每个元素都有一个特定的位置和数值,这些元素称为图画元素、图像元素或像素。
数字图像处理:是借助数字计算机对图像信息进行加工以满足人的视觉或应用需求的行为。
1.2 图像处理技术划分
划分为三个等级:低级处理、中级处理、高级处理。
低级处理:主要对图片进行一些简单的操作,比如:降噪、增强对比度和图像尖锐化。降低噪声可以用于滤波。
图像增强的原则是处理某个给定的图像,使其结果较源图像更便于后续的操作与应用,主要解决由于图像的灰度级范围较小造成的对比度较低的问题,目的就是将输出图像的灰度级放大到指定的程度,使得图像中的细节看起来增加清晰。
中级处理:比如把一幅图像分为不同区域或目标,即图像分割,以使得其更好被识别分类,也称为目标检测。
高级处理:即理解图像。
1.3 图像取样和量化
模拟图像:连续,大多数传感器的输出是连续电压波形
数字图像:离散
模拟图像→离散化→数字图像→交给计算机处理:包括取样和量化这两个过程
1.3.1 取样和量化的基本概念
取样,就是把一幅连续图像在空间上分割成M×N个网格,每个网格用一亮度值来表示,一个网格称为一个像素。
取样操作:先将二维信号变成一维信号,再对一维信号进行取样。具体做法是,先沿垂直方向按一定间隔从下到上顺序地沿水平方向直线扫描,取出各水平线上灰度值的一维扫描,再对一维扫描线信号按一定间隔取样得到离散信号,即先沿着垂直方向取样,再沿着水平方向取样这两个步骤完成取样操作。
取样示意图如下图所示。
取样间隔的大小选取要依据原图像中包含的细微变化来决定,一般来说,图像细节越多,取样间隔应越小。
量化就是把取样点上对应的亮度连续变化区间转换为单个特定数码的过程。量化后,图像就被表示成一个整数矩阵。每个像素具有两个属性:位置和灰度,位置由行、列表示,灰度表示该像素位置上亮暗程度的整数。此数字矩阵M×N就作为计算机处理的对象了。灰度级一般为0-255(8bit量化)。
量化的方法有两种:一是等间隔量化, 一是非等间隔量化。
等间隔量化就是简单地把采样值的灰度范围等间隔地分割并进行量化。对于像素灰度值在黑—白范围较均匀分布的图像,这种量化方法可以得到较小的量化误差。该方法也称为均匀量化或线性量化。
非均匀量化是依据一幅图像具体的灰度值分布的概率密度函数,按总的量化误差最小的原则来进行量化。具体做法是对图像中像素灰度值频繁出现的灰度值范围,量化间隔取小一些,而对那些像素灰度值极少出现的范围,则量化间隔取大一些。 由于图像灰度值的概率分布密度函数因图像不同而异, 所以不可能找到一个适用于各种不同图像的最佳非等间隔量化方案。因此, 实用上一般都采用等间隔量化。
一般来说,为了得到质量较好的图像可以采取如下原则:
对于缓变的图像,应细量化粗取样,以避免假轮廓;
对于细节丰富的图像,应粗量化细取样,以避免模糊;
对于彩色图像,应按照颜色成分分别取样和量化。
1.3.2 数字图像表示
三种表示方法:
- 函数,即用两个坐标轴决定空间位置,第三个坐标轴决定f的值,f是x和y的函数。
- 可视灰度矩阵的图像,优点在于能够即时查看结果。
- 二维数值阵列的图像。
1.3.3 线性索引和坐标索引
坐标索引,即一个像素的位置由其他二维坐标给出的约定。
线性索引,由一个一维的非负整数串组成,这个非负整数串是通过计算到坐标(0,0)的偏移量得到的。线性索引主要有两种,一种是基于图像的行扫描,一种是基于图像的列扫描。
下图是将坐标索引转换为列扫描的线性索引。
1.3.4空间分辨率和灰度分辨率
空间分辨率:图像中最小可辨别细节的测度,测量方式:单位距离的线对数和单位距离的点数(像素数)。
灰度分辨率:指灰度级中可分辨的最小变化,通常是指量化灰度时所用的比特数,一般是2的整数次幂,比如通常一幅图是256级的图像有8比特灰度分辨率。
1.3.5 图像内插
内插一般在图像放大、缩小、旋转和几何校正等任务中使用。内插是用已知数据来估计未知未知的值的过程。
内插方法包括:
①最近邻内插
②双线性内插
③双三次内插
1.4 像素间的基本关系
1.4.1 相邻像素——4邻域
像素p(x,y)的4邻域是:(x+1,y),(x-1,y),(x,y+1),(x,y-1),即2个相邻的水平像素和2个垂直在像素。
一
般
我
们
用
N
4
(
p
)
表
示
像
素
p
的
4
邻
域
。
一般我们用N_4(p)表示像素p的4邻域。
一般我们用N4(p)表示像素p的4邻域。
1.4.2 相邻像素——D邻域
D邻域定义:像素p(x,y)的D邻域是:对角上的点(x+1,y+1),(x+1,y-1),(x-1,y+1),(x-1,y-1)
一
般
我
们
用
N
D
(
p
)
表
示
像
素
p
的
D
邻
域
。
一般我们用N_D(p)表示像素p的D邻域。
一般我们用ND(p)表示像素p的D邻域。
1.4.3 相邻像素——8邻域
8邻域定义:像素p(x,y)的8邻域是4邻域的点+D邻域的点
用N8§表示像素p的8邻域
1.4.4 像素的连通性——4连通
具有值V中的两个像素p和q,如果q在集合N4(q)中时,则称p和q两个像素是4连通。
同理,还有8连通。
1.4.5 像素的连通性——m连通
具有值V中的两个像素p和q,如果:
1.q在集合N4§中,或
2.q在集合ND§中,并且N4§与ND§的交集为空(没有值V的像素)
则称这两个像素是m连通,即4连通和D连通的混合连通
1.4.6 像素的连通性——通路
通路的定义:一条从具有坐标(x,y)的像素p,到具有坐标(s,t)的像素q的通路,是具有坐标
x
(
x
0
,
y
0
)
,
(
x
1
,
y
1
)
,
…
,
(
x
n
,
y
n
)
x(x_0,y_0),(x_1,y_1),…,(x_n,y_n)
x(x0,y0),(x1,y1),…,(xn,yn)
的不同像素的序列。其中,
(
x
0
,
y
0
)
=
(
x
,
y
)
,
(
x
n
,
y
n
)
=
(
s
,
t
)
(
x
i
,
y
i
)
和
(
x
i
−
1
,
y
i
−
1
)
是
邻
接
的
(x_0,y_0)=(x,y),(x_n,y_n)=(s,t)\\(x_i,y_i)和(x_{i-1},y_{i-1})是邻接的
(x0,y0)=(x,y),(xn,yn)=(s,t)(xi,yi)和(xi−1,yi−1)是邻接的
1≤i≤n,n是路径的长度。如果
(
x
0
,
y
0
)
=
(
x
n
,
y
n
)
(x_0,y_0)=(x_n,y_n)
(x0,y0)=(xn,yn)
则该通路是闭合通路。
1.4.7 像素的连通性——距离
- 欧几里得距离
- 城市街区距离
- 棋盘距离
1.5 基本数学工具
-
对应元素运算和矩阵运算
-
线性运算与非线性运算
-
算术运算
使用图像相加降低噪声,例如:①去除叠加性噪声。②生成图像叠加效果。使用图像相减比较图像,例如:①显示两幅图像的差异,检测同一场景两幅图像之间的变化。②如分割运动的车辆,减法去掉静止部分,剩余的是运动元素和噪声。
使用图像相乘/相除校正阴影和模板,例如:图像的局部显示:用二值掩模图像与原图像做乘法。
-
集合运算和逻辑运算
非运算,例如:①获得一个阴图像;②获得一个子图像的补图像
与运算,例如:①求两个子图像的相交子图;②模板运算:提取感兴趣的子图像
或运算,例如:①合并子图像;②获得相交子图像 -
空间运算
单像素运算
邻域运算
几何变换