数字图像处理--冈萨雷斯第4版--第二章 数字图像基础

第二章 数字图像基础

2.1 视觉感知要素

图像形成并被人类感知的基本原理,并根据数字图像处理时所用的一些要素来了解人类视觉的物理限制

2.1.1 人眼的结构

在这里插入图片描述
人眼的解剖结构
在这里插入图片描述
杆状体和锥状体:两类光感受器

光感受器数量分布位置特性
锥状体600~700万个主要分布在视网膜中央凹对颜色高度敏感;每个锥状体连接自身的神经末梢,肌肉控制眼球转动,使部分区域图像落在中央凹,分辨细节;锥状体视觉被称为明/亮视觉
杆状体7500~1500万个分布面积大捕获视野中的整个图像;没有色觉,对低光照敏感;杆状体视觉被称为暗/微光视觉

2.1.2 人眼中图像的形成

在这里插入图片描述
普通照相机:镜头的焦距固定,通过改变镜头和成像平面之间的距离来实现不同距离的焦距

人眼:晶状体与成像区域(视网膜)之间的距离是固定的,通过改变晶状体的形状得到正确聚焦的焦距

视网膜图像主要聚焦在中央凹区域,光感受器的相对激励作用产生感知,把辐射能量转换为最终由大脑解码的电脉冲

2.1.3 亮度适应与辨别

主观亮度:人类视觉系统感知的亮度

低照明级别,视觉由杆状体执行
高照明级别,视觉由锥状体执行

感知亮度不是实际灰度的简单函数
1.视觉系统往往会在不同灰度区域的边界处出现"下冲"或"上冲"现象,如马赫带现象

2.一个区域的感知亮度并不只是取决于其灰度,如同时对比现象

2.2 光和电磁波谱

波长(λ)和频率(v)的关系
λ = c v \lambda = \frac{c}{v} λ=vc
c = 2.998*10^8 m/s 是光速

电磁波谱各分量的能量为
E = h v E=hv E=hv
电磁波可视为以波长λ传播的正弦波,或视为没有质量的粒子流,每个粒子像波浪一样行进并以光速运动,每个无质量的粒子都是具有一定能量的粒子,频率越高,能量越高。

可见光谱
在这里插入图片描述
感知物体的颜色由物体反射的光的性质决定,例如,绿色物体主要反射波长范围为500~570nm的光,并吸收其他波长的大部分能量

单色光:没有颜色的光,唯一属性是亮度,单色光从黑到白的数值范围通常称为灰度级,单色图像通常称为灰度图像

2.3 图像感知与获取

大多图像的产生:“照射”源和形成图像的“场景”元素对光能的反射或吸收

在某些应用中,反射的能量或透射的能量被聚焦到一个光转换器上,光转换器把能量转换成可见光

在这里插入图片描述
组合输入电能和传感器对正被检测能量的响应,将入射能量转换成电压。输出电压波形是传感器的响应,将传感器响应数字化,得到一个数字量

2.3.1 使用单个传感器获取图像

要使用单个传感器生成二维图像,传感器和成像区域之间必须要有x方向和y方向的相对位移
在这里插入图片描述

2.3.2 使用条带传感器获取图像

在这里插入图片描述

2.3.3 使用阵列传感器获取图像

以二维阵列形式排列各个感测元件
CCD(电荷耦合器件)阵列:可制造成具有较宽范围的传感特性,并能封装成具有更多单元的稳定阵列
在这里插入图片描述

2.3.4 一个简单的成像模型

f(x,y)来表示图像,在某一空间坐标处的f的值是一个标量,与物理源辐射的能量成正比,f(x,y)一定是非负的和有限的
0 ≤ f ( x , y ) < ∞ 0\le f(x,y)<\infty 0f(x,y)<
同时
f ( x , y ) = i ( x , y ) r ( x , y ) f(x,y)=i(x,y)r(x,y) f(x,y)=i(x,y)r(x,y)
0 ≤ i ( x , y ) < ∞ 0\le i(x,y)<\infty 0i(x,y)<
0 ≤ r ( x , y ) < 1 0\le r(x,y)<1 0r(x,y)<1
i(x,y)入射分量,取决于照射源
r(x,y)反射分量,取决于被成像物体的特性,限制在0(全吸收)1(全反射)之间

在投射成像的情况下,r(x,y)是透射分量

2.4 图像取样和量化

2.4.1 取样和量化的基本概念

将一幅连续图像f转换为数字形式

取样(采样):对函数坐标值数字化
量化:对函数幅度值进行数字化

以条带传感器为例
在这里插入图片描述

2.4.2 数字图像表示

1.三维图像表示
2.可视灰度矩阵表示
3.二维数值阵列表示:矩阵中的每一个单元称为图像单元、图像元素或像素
在这里插入图片描述
在这里插入图片描述
MxN的数字图像的中心,M/N除以2后四舍五入最接近的整数得到

离散灰度级数L通常取2的整数次幂
L = 2 k L=2^k L=2k
动态范围:灰度跨越的值域
存储数字图像所需的比特数b:
b = M N k b=MNk b=MNk
当一幅图像具有2^k个可能的灰度级时,我们称该图像是一幅k比特图像
如256级图像称为一幅8比特图像

2.4.3 线性索引和坐标索引

线性索引:由一个一维的非负整数串组成
分为行扫描和列扫描

坐标索引:由二维坐标索引
在这里插入图片描述

2.4.4 空间分辨率和灰度分辨率

空间分辨率:图像中最小可辨别细节的测度

如何定量的说明空间分辨率:使用单位距离线对数和单位距离的点数(像素数)

点数/英寸(dpi):单位距离内可分辨的最大线对数,是印刷和出版业中常用的图像分辨率的测度

空间分辨率的测度必须针对空间单位声明才有意义,如果未声明图像包含的空间维数,那么说一幅图像的分辨率是没有意义的

灰度分辨率:灰度级中可分辨的最小变化,灰度级数通常是2的整数次幂,最常用的数是8比特;灰度分辨率通常是指量化灰度时所用的比特数(如8bit)

空间和灰度分辨率之间可能存在的关系
三类图像的等偏爱曲线
在这里插入图片描述
在这里插入图片描述
等偏爱曲线上的点对应于等主观质量的图像,越接近右上角喜爱程度越高

2.4.5 图像内插

内插:用已知数据来估计未知位置的值的过程

例:如何将大小为500x500像素的一幅图像放大到750x750像素?
最近邻内插:创建一个750x750的假想网格,网格的像素间隔完全于原图像的像素间隔相同,然后收缩网格,使其完全于原图像重叠,收缩后的像素间隔要小于原图像,我们再下伏原图像中找到最接近的像素,并把该像素的灰度赋给750x750网格中的新像素
缺点:会产生人为失真

双线性内插:使用4个最近邻灰度计算给定位置的灰度
v ( x , y ) = a x + b y + c x y + d v(x,y)=ax+by+cxy+d v(x,y)=ax+by+cxy+d
4个系数可由4个最近邻点写出的4个未知方程求出

双三次内插:包括16个最近邻点
v ( x , y ) = ∑ i = 0 3 ∑ j = 0 3 a i j x i y j v(x,y)=\sum_{i=0}^{3} \sum_{j=0}^{3}a_{ij}x^iy^j v(x,y)=i=03j=03aijxiyj

2.5 像素间的一些基本关系

2.5.1 像素的相邻像素

4邻域(N_4( p )):(x+1,y), (x-1,y), (x,y+1), (x,y-1)
4对角相邻像素(N_D( p )):(x+1,y+1), (x+1,y-1), (x-1,y+1), (x-1,y-1)
8邻域:两者之和

2.5.2 邻接、连通、区域、边界

V是用于定义邻接的灰度值集合
三种类型的邻接
在这里插入图片描述
混合邻接示意图
在这里插入图片描述

2.5.3距离测度

欧几里得距离
D e ( p , q ) = [ ( x − u ) 2 + ( y − v ) 2 ] 1 2 D_e(p,q)=[(x-u)^2+(y-v)^2]^\frac{1}{2} De(p,q)=[(xu)2+(yv)2]21
城市街区距离
D 4 ( p , q ) = ∣ x − u ∣ + ∣ y − v ∣ D_4(p,q)=|x-u|+|y-v| D4(p,q)=xu+yv
在这里插入图片描述
棋盘距离
D 8 ( p , q ) = m a x ( ∣ x − u ∣ , ∣ y − v ∣ ) D_8(p,q)=max(|x-u|,|y-v|) D8(p,q)=max(xu,yv)
在这里插入图片描述

2.6 数字图像处理所用的基本数学工具介绍

2.6.1 对应元素运算和矩阵运算

对应元素运算
在这里插入图片描述

矩阵运算
在这里插入图片描述

2.6.2 线性运算与非线性运算

线性运算
H [ f ( x , y ) ] = g ( x , y ) H[f(x,y)]=g(x,y) H[f(x,y)]=g(x,y)
H [ a f 1 ( x , y ) + b f 2 ( x , y ) ] = a H [ f 1 ( x , y ) ] + b H [ f 2 ( x , y ) ] = a g 1 ( x , y ) + b g 2 ( x , y ) H[af_1(x,y)+bf_2(x,y)]=aH[f_1(x,y)]+bH[f_2(x,y)]=ag_1(x,y)+bg_2(x,y) H[af1(x,y)+bf2(x,y)]=aH[f1(x,y)]+bH[f2(x,y)]=ag1(x,y)+bg2(x,y)
如求和算子Σ

非线性运算
非线性算子如最大值算子

2.6.3 算术运算

在这里插入图片描述
使用图像相加平均/降低噪声:对K幅不同的噪声图像取平均值

使用图像相减比较图像
使用图像相乘/相除校正阴影和模板

2.6.4 集合运算和逻辑运算

在这里插入图片描述
在这里插入图片描述

2.6.5 空间运算

单像素运算
s = T ( z ) s=T(z) s=T(z)
在这里插入图片描述

邻域运算
g ( x , y ) = 1 m n ∑ ( r , c ) ∈ S x y f ( r , c ) g(x,y)=\frac{1}{mn}\sum_{(r,c)\in S_{xy}}f(r,c) g(x,y)=mn1(r,c)Sxyf(r,c)
可进行局部平均

几何空间变换

改变图像中像素的空间排列,通常称为橡皮膜变换,类似于再一块橡皮膜上打印图像,然后根据预定义的一组规则来拉伸或收缩橡皮膜

由两种基本运算组成
(1)坐标的空间变换
(2)灰度内插
仿射变换
在这里插入图片描述
可以用该矩阵来表示所有4个仿射变换:缩放变换,平移变换,旋转变换,剪切变换
在这里插入图片描述
图像旋转和灰度内插
图像配准

2.6.6 向量与矩阵运算

多光谱图像处理
在这里插入图片描述

2.6.7 图像变换

2.6.8 图像灰度和随机变量

  • 0
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
完整PDF电子书下载 带索引书签目录高清。642页,绝对的完整、高清,有目录,带索引书签。 数字图像处理 冈萨雷斯 第三 中文本 在数字图像处理领域 《数字图像处理 第三 》作为主要教材已有30多年 这一本是作者在前两基础上修订而成的 是前两的发展与延续 除保留了前两的大部分内容外 根据读者的反馈 作者在13个方面对《数字图像处理 第三 》进行了修订 新增了400多幅图像 200多幅图表及80多道习题 融入了近年来数字图像处理领域的重要进展 因而《数字图像处理 第三 》特色鲜明且与时俱进 《数字图像处理 第三 》仍分为12章 即绪论 数字图像基础 灰度变换与空间滤波 频率域滤波 图像复原与重建 彩色图像处理 小波和多分辨率处理 图像压缩 形态学图像处理 图像分割 表示与描述 目标识别   《数字图像处理 第三 》的读者对象主要是从事信号与信息处理 通信工程 电子科学与技术 信息工程 自动化 计算机科学与技术 地球物理 生物工程 生物医学工程 物理 化学 医学 遥感等领域的大学教师和科技工作者 研究生 大学本科高年级学生及工程技术人员 ">数字图像处理 冈萨雷斯 第三 中文本 在数字图像处理领域 《数字图像处理 第三 》作为主要教材已有30多年 这一本是作者在前两基础上修订而成的 是前两的发展 与延续 除保留了前两的大部分内容外 根据 [更多]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

我怎么对这么多事情都感兴趣

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值