第二章概述:
- 视觉感知要素
- 图像的获取、取样和量化
- 像素间的一些基本关系
文章目录
视觉感知要素
- 视网膜成像
- 人的视觉系统能够适应的光强度级别范围是很宽的–从暗阈值到强闪光约有 1 0 10 10^{10} 1010个量级。
- 视觉系统不可能同时在整个范围内工作。它是通过改变灵敏度来完成这一较大的变动的,这就是亮度适应现象。
- 视觉系统对亮度的感知不是简单的强度函数。例如马赫带现象和同时对比现象。
光和电磁波谱
- 我们感受到的可见光的彩色范围只占电磁波的一小部分。
- 原理上,如果可以开发出一种传感器来检测由一种电磁波谱发射的能量,那么我们就可以在该波段上对感兴趣的事件成像。(数字图像处理处理的图像并不只是可见光产生的图像,也可以是其他光成像,例如X光成像)。
图像感知和获取
- 我们感兴趣的多数图像都是由“照射”源和形成图像的“场景”元素对光能的反射或吸收而产生的。
- 有三种图像传感器:单个传感器,条带传感器,阵列传感器。
简单的图像形成模型
函数
f
(
x
,
y
)
f(x,y)
f(x,y)可由两个分量来表征:
(
1
)
(1)
(1) 入射到被观察场景到光源照射总量;
(
2
)
(2)
(2) 场景中物所反射的光照总量。
这两个分量分别称为入射分量和反射分量,且分别表示为
i
(
x
,
y
)
i(x,y)
i(x,y),
r
(
x
,
y
)
r(x,y)
r(x,y)。两个函数作为一个乘积合并形成
f
(
x
,
y
)
f(x,y)
f(x,y),即:
f
(
x
,
y
)
=
i
(
x
,
y
)
r
(
x
,
y
)
f(x,y) = i(x,y) r(x,y)
f(x,y)=i(x,y)r(x,y)
其中,
0
<
i
(
x
,
y
)
<
∞
0 < i(x,y) < ∞
0<i(x,y)<∞,
0
<
r
(
x
,
y
)
<
1
0 < r(x,y) < 1
0<r(x,y)<1。
图像取样和量化
一幅连续图像 f f f,我们想把它转换成数字形式。一幅图像的 x x x和 y y y坐标及幅度可能都是连续的。为将它转换为数字形式,必须在坐标上和幅度上都进行取样操作。对坐标值进行数字化称为取样,对幅值数字化称为量化。
数字图像表示
取样和量化的结果是一个实际矩阵。可以用矩阵形式表示一幅数字图像,也可以用变量和幅值都是整数的二维函数表示。
- 数字化过程中对 M M M和 N N N除了必须取整数外没有其他要求。然后出于处理、存储和取样硬件的考虑,灰度级典型的取值是2的整数次幂。
- 对于一幅大小为 M × N M \times N M×N,灰度级 L = 2 k L = 2^k L=2k的数字图像,所需的存储空间为 b = M × N × k b = M \times N \times k b=M×N×k。
- 当一幅图像有 2 k 2^k 2k灰度级时,通常称该图像为 k k k比特图像。
空间和灰度级分辨率
空间分辨率
- 取样值(取样数目)是决定一幅图像空间分辨率的主要参数。空间分辨率是图像中可辨别的最小细节。
- 广泛使用的图像分辨率的定义是每单位距离可分辨的最大线对数量(每毫米100个线对)。
- 很多时候讨论线对,主要是为了说明反应原始场景中的细节的能力。空间分辨率的度量必须针对空间单位来规定才有意义。图像大小本身并不会告诉我们全部内容。如果没有规定图像包含的空间维数,那么我们说一幅图像的分辨率为 1024 × 1024 1024\times1024 1024×1024像素是没有意义的。不要把线对理解为对于数字图像本身的一个分辨率,这样的话线对是没有什么意义的。
灰度分辨率
- 灰度分辨率是指在灰度级中可分辨的最小变化。
- 当没有必要对涉及像素的物理分辨率进行实际度量和在原始场景中分析细节等级时,通常就把大小为 M × N M \times N M×N,灰度为 L L L级的数字图像称为空间分辨率为 M × N M \times N M×N像素、灰度级分辨率为 L L L级的数字图像。
改变取样数目对图像的影响
下图显示了一幅
1024
×
1024
1024 \times 1024
1024×1024像素的图像,其灰度用8比特来表示。 其他图像是对原图抽样的结果。
通过复制行或列使抽样后的图像复原到原来的大小。
改变图像取样数目会影响图像对细节的分辨能力。
改变图像灰度级的影响
在这个例子中保持取样数恒定,而以2的整数次幂把灰度级从256减少至2。
在图示的32灰度级图像中,有一处细小山脊状结构。这种效果是由数字图像的平滑区域中的灰度级数不足引起的,通常称为伪轮廓。 – 随着灰度级数目的减少,在图像中灰度级只差1的像素显示的明暗有一个比较大的变化。
放大和收缩数字图像
- 放大和收缩数字图像适用于数字图像。取样和量化适用于将一幅连续的传感图像变为数字图像。
- 放大和收缩数字图像要求执行两步:
- 计算新的像素在原图的对应位置。
- 为这些对应位置赋灰度值。
计算新的像素的对应位置
f
(
x
,
y
)
f(x,y)
f(x,y)表示输出图像,
g
(
u
,
v
)
g(u,v)
g(u,v)表示输入图像。几何运算(图像的放大或缩小也是图像的几何运算)可定义为:
f
(
x
,
y
)
=
g
(
u
0
,
v
0
)
=
g
[
a
(
x
,
y
)
,
b
(
x
,
y
)
]
f(x,y) = g(u_0,v_0) = g[a(x,y),b(x,y)]
f(x,y)=g(u0,v0)=g[a(x,y),b(x,y)]
- 如果令: u 0 = a ( x , y ) = x ; v 0 = b ( x , y ) = y u_0 = a(x,y) = x; v_0 = b(x,y) = y u0=a(x,y)=x;v0=b(x,y)=y。那么仅仅是把 g g g拷贝到 f f f而不加任何改动的恒等运算。
- 如果令: u 0 = a ( x , y ) = x + x 0 ; v 0 = b ( x , y ) = y + y 0 u_0 = a(x,y) = x + x_0; v_0 = b(x,y) = y + y_0 u0=a(x,y)=x+x0;v0=b(x,y)=y+y0。那么得到平移运算,其中点 ( x 0 , y 0 ) (x_0,y_0) (x0,y0)被平移到原点。即 f ( 0 , 0 ) = g ( x 0 , y 0 ) f(0,0) = g(x_0, y_0) f(0,0)=g(x0,y0)。
- 如果令: u 0 = a ( x , y ) = x / c ; v 0 = b ( x , y ) = y / d u_0 = a(x,y) = x/c; v_0 = b(x,y) = y/d u0=a(x,y)=x/c;v0=b(x,y)=y/d。那么会使图像在 x x x轴放大 c c c倍,在 y y y轴放大 d d d倍。
栗子?
例如:将一幅
200
×
200
200 \times 200
200×200的图像
g
(
u
,
v
)
g(u,v)
g(u,v)放大1.5倍,那么将得到
300
×
300
300 \times 300
300×300的新图像
f
(
x
,
y
)
f(x,y)
f(x,y)。产生新图像的过程,实际就是为
300
×
300
300 \times 300
300×300的像素赋值的过程。
假如为
f
(
150
,
150
)
f(150,150)
f(150,150)赋值:
f
(
150
,
150
)
=
g
(
150
/
1.5
,
150
/
1.5
)
=
g
(
100
,
100
)
;
f(150,150) = g(150/1.5,150/1.5) = g(100,100);
f(150,150)=g(150/1.5,150/1.5)=g(100,100);
假如为
f
(
100
,
100
)
f(100,100)
f(100,100)赋值:
f
(
100
,
100
)
=
g
(
100
/
1.5
,
100
/
1.5
)
=
g
(
66.7
,
66.7
)
;
f(100,100) = g(100/1.5,100/1.5) = g(66.7,66.7);
f(100,100)=g(100/1.5,100/1.5)=g(66.7,66.7);
为这些对应位置赋灰度值(插值)
因 ( u 0 , v 0 ) (u_0,v_0) (u0,v0)不一定要在坐标点上,故需插值求 g ( u 0 , v 0 ) g(u_0,v_0) g(u0,v0)。
方法一:最近邻法
取点 ( u 0 , v 0 ) (u_0,v_0) (u0,v0)最近的整数坐标 ( u , v ) (u,v) (u,v)
方法二:双线性插值
根据四个邻点灰度值通过插值计算 g ( u 0 , v 0 ) g(u_0,v_0) g(u0,v0)
在这之前,回忆一下一维线性插值:
双线性插值
三次一维线性插值:前两次在 u u u方向上,第三次是在 v v v方向上。