数字图像处理(书内笔记)

书上的内容比较晦涩难懂,涉及到物理数学知识,这里仅仅做一个粗略的总结笔记。
笔记的总结主要来源于:原文
第一次学习机器视觉,参考了人家的博客

第一章 绪论

1.数字图像处理的基本步骤

数字图像处理有两大类,一类是其输入和输出都是图像,另一类,输入可能是图像,但输出是从图像中提取的特征属性。
一般图像处理有:
①图像获取(图像获取中通常还包括有比例尺的设定等预处理环节)
②图像增强:增强技术后面的思路通常是显现那些被模糊的了细节,或简单地突出一副图像中感兴趣的特征,增强是图像处理中非常主观的领域。
③图像复原:图像复原是改进图像外貌的一个领域,图像复原是客观的,以一些数学模型为基础。
④彩色图像处理
⑤压缩:减少图像的存储量,或者在传输图像的时候降低频带。
⑥形态学处理
⑦分割:简单地说,是将一副图像分为组成部分或者目标物,需要有成熟的算法
⑧表示与描述:这个步骤几乎总是跟随在分割步骤的输出后边,通常这一输出是未加工的数据,其构成不是区域的边缘就是其区域的所有点。无论哪种情况,把数据转化为计算机处理的形式都是必要的。首先,必须确定数据时应该被表现为边界还是整个取余。当注意的焦点是外部形状特性(如拐角和曲线)时,那么边界的表示将就是合适的,当注意的焦点是内部特性(如纹理或者骨骼形状)时,则区域表示就是合适的。描述也叫特征选择,涉及提取特征,该特征某些感兴趣的鼎力信息或者说区分一组目标与其他目标的基础。
⑨识别:基于目标的描述给目标赋以符号的过程

2.图像处理的存储

大规模的存储能力在图像处理中是必须的。
图像处理应用的存储分为三个主要类别:①用于处理时的短期存储②关系到快速调用的在线存储③档案存储,其特点是频繁访问。
提供短期存储的一种方法是使用计算机内存,另一种是采用专门的板,该存储板叫做帧缓存(缓冲存储器),它们可以存储一帧或者多帧图像并可快速访问,通常以视频速率(30帧/秒)访问。后一种方法允许实际意义上的快速图像变焦以及卷动(垂直移动)和摇(水平移动)。帧缓存通常放在专业的图像处理硬件单元中。
在线存储一般采用磁盘或光介质存储,在线存储的关键特性是对存储数据的访问频率。
档案存储是以海量存储要求为特点的,但无需频繁访问。

第二章 数字图像基础

一些概念

①单色光(消色):没有颜色的光,这种光的属性是它的强度或者大小
②灰度级:这一词汇通常用来描述单色光强度,因为它的范围从黑到灰,最后到白。
③发光强度:从光源流出能量的总量
④光通量:观察者从光源感受到的能量
⑤亮度:光感受的主观描绘子

简单图像的形成

用f(x,y)二维函数形式表示图像,在特定的坐标(x,y)处,f的值或幅度是一个正的标量
函数可以用两个分量来表征:①入射到观察场景的光源总量和②场景中物体反射光的总量。
相应的称为入射分量和反射分量f(x,y)=i(x,y)r(x,y);需要注意的是反射分量限制在0(全吸收)和1(全反射)之间,

图像取样和量化

①采样:将空间中连续的图像变换成为离散点的操作称为采样
②量化:图像采样后分割成离散的像素,但是其灰度值是连续的,计算机无法处理这种数据结构类型,所以为了便于处理,将连续的灰度值转化为离散的数值的这个过程称之为量化。

像素之间的关系

图片中的像素可以以矩阵的方式表示出来,那么在一个像素,它的上下左右组成的这么一个区域称之为4领域,同理,形成的一个3*3方格中,以该像素为中心,其余8个像素称之为8领域

连通性

为了确定两个像素是否连通,必须确定它们是否相邻以及它们的灰度是否满足特定的相似性准则,(或者说,它们的灰度值是否相等),例如:当两个像素是四邻接的,但是仅当它们的灰度值相同时,才能说它们是连通的。
那么在这里,可以定义一个集合V,该集合V用于存储邻接性的灰度值集合,(V是一个规则,用于定义它们的邻接性),如果两个像素位于四领域内,而且满足集合V中的规则,那么就可以说成pq是四邻接,邻接性就是连通性。
4邻接必然是8邻接。m邻接必然是8邻接,m邻接是位于4邻接和8邻接之间的。

距离

像素在空间的接近程度可以用像素之间的距离来度量
p和q之间的欧式距离(简单理解成两点之间的距离)
p和q之间的D4距离(也叫做城市街区距离):简单理解为从p像素出发只能四个基本方向移动,所走过的距离,那么根据D4距离,也可以说,从p像素出发,下一个点是p的四领域,每次的路径都是上一个像素点的四领域,最终到达q,这个也可以理解为D4距离
p和q之间的D8距离(也叫做棋盘距离):两点之间的棋盘距离就是以这两点为一条对角线的矩形的较长的那一条边,由于D8的理解与上述一致,故不赘述

图像的分类

①按照动态特性:可以分为静止图像和运动图像
②按照图像的色彩:可以分为灰度图像和彩色图像
③按图像的维度:二、三、多

位图

位图是静止图像的一种,位图是通过许多像素点表示的一副图像,每个像素具有颜色属性和位置属性
可以具体分为:
①二值图像:二值图像只有黑白两种颜色,一个像素仅占1,0表示黑,1表示白,或者相反
②亮度图像:在亮度图像中,每个像素都是介于黑色和白色之间的256(=256)种灰度中的一种
③索引图像
④RGB图像

第三章 图像的基本运算

1.点运算

点运算:是指对一幅图像中的每一个像素点的灰度值进行计算,点运算是一种像素的逐点运算,是灰度到灰度的映射过程。
点运算的分类:线性点运算、非线性点运算

对于线性点运算:灰度变换函数可以采用线性方程描述,该方程为s=ar+b,通过改变各种参数,可以达到不同的效果

对于非线性点运算:输出灰度级与输入灰度级呈非线性关系,常见的有对数变换和幂次变换

注意问题:
1.点运算不会改变图像内像素点之间的空间关系。
注意点运算的概念是对以一幅图像的每一个像素点的灰度值进行分别的计算,并不会改变各像素之间的关系。

2.代数运算

基本上可以理解为将两幅图像的各个像素点提取出来,对其进行加减乘除的运算

3.逻辑运算

与或运算可以从一幅图像中提取子图像

4.几何运算

改变图像中物体对象(像素之间的空间关系)几何变换可以分为图像的位置变换(平移、镜像、旋转)、形状变换(放大、缩小)以及图像的复合变换等。
在运算中,对于运算后的图像,在原图中没有对应的点,可以用0或者1填充。
运算的类型:
①平移:简单来说就是每一个像素点加上对应的偏移坐标,可以直接采用平面解析几何的方式来计算
②图像的水平镜像
x1=-x0+w;y1=y0;
对称轴为(x1+x0)/2,或者可以写为w/2
③图像的垂直镜像
x1=x0;
y1=-y0+h
对称轴为(y1+y0)/2或者是h/2
④图像的旋转
x=x0cosβ+y0sinβ
y=-x0sinβ+y0cosβ
图像旋转之后,由于数字图像的坐标值一定是整数,因此,可能引起图像部分像素点的局部改变,因此图片的大小也有可能会发现改变
为了避免图像信息的丢失,图像旋转后必须进行平移变换(或者先平移,再旋转)。
图像旋转之后,会出现许多空洞点,我们需要对这些空洞点必须进行填充处理,进行插值处理。

5.图像的缩放

全比例缩放:在给定的图像在x方向和y方向按照相同比例a缩放。
公式:x1=ax0 y1=ay0;
不同比例缩放:在给定的图像在x方向和y方向按照不同比例a,b缩放。
公式:x1=ax0,y1=by0
在图像放大的正变换中,出现了很多的空格。因此,需要对放大后所多出来的一些空格填入适当的像素值。一般采用最近邻插值和线性插值法。
最邻近插值:最近邻法是将点最近的整数坐标点的灰度值取为点的灰度值。

在该点各相邻像素间灰度变化较小时,这种方法是一种简单快捷的方法,但当该点相邻像素间灰度差很大时,这种灰度估值方法会产生较大的误差。

双线性插值法:是最邻近法的改进版,效果较好,但是具有低通滤波性,使高频分量受损,图像轮廓受损。可以采用效果更好的三次内插法。

三次内插法:可精确地恢复原函数,当然也就可精确得到采样点间任意点的值。此方法计算量很大,但精度高,能保持较好的图像边缘。

第五章 图像增强

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值