数字图像处理笔记第一周
绪论
分类:
狭义图像处理(像素):图像数字化、图像变换(傅里叶)、图像增强、恢复与重建、编码(简化与压缩)
图像分析(目标):图像分割(首要步骤)、二值图像处理与分析、纹理分析
图像理解(符号):图像识别(分类解译)
特点:
精度高、再现性好、通用性好、灵活性强
应用:
应用广泛
图像数字化
把图片分成若干像元或像素,并将各个区域的灰度用整数来表示,形成点阵式数字图像
主要包括采样和量化两个过程
像素的属性=(位置,灰度/颜色RGB)
数字图像的表示
方法:矩阵,数字图像的左上角像素中心为坐标原点
分类:根据灰度级数的差异分为:黑白、灰度、彩色三种
1.黑白图像:
又称为二值图像,非黑即白,每个像素仅由一位二进制数表示,其表示的颜色只有黑白两种。
2.灰度图像:
每个像素由八位二进制数表示,因此可以组合出256种不同的“亮暗变化”,数值越高越亮,此灰度级数为256级灰度。
3.彩色图像:
彩色图像是指每个像素由RGB分量构成的,而每个像素对应的R、G、B又分别由8位二进制数据表示,也就是说每个像素对应着3字节的信息,可以组合出256256*256种颜色,灰度级应为256级
图像数字化表示
1.采样:
将空间上连续的图像变换成离散点的操作。(间隔和孔距)
2.量化:
将像素灰度转换成离散的整数值的过程
图像数据量=MNg(bit)
采样、量化参数与数字化图像间的关系:
比较易于理解:两方面——采样和量化,越细致,质量越好,数据量越大
图像数字化设备
数字化器必须能够将图像划分为若干像素并分别给它们地址,能够度量每一像素的灰度并量化为整数,能够将这些整数写入存储设备。
数字化器组成:
1.采样孔
2.图像扫描机构
3.光传感器
4.量化器
5.输出存储体
灰度直方图
概念
灰度直方图是反映一幅图像中各灰度级像素出现的频率与灰度级的关系。以灰度级为横坐标,频率为纵坐标,绘制频率同灰度级的关系图就是一幅灰度图像的直方图。它是图像的一个重要特征,反映了图像灰度分布的状况。
频率计算式为:vi=ni/n
vi:代表灰度级为i的像素出现的频率
ni:代表灰度级为i的像素出现的个数
n:图像的总像素
如下图就是表示当每一位像素都用3个二进制数的数据来表示时可以得到的有关像素级数为8的相关0-7(十进制统计)的灰度直方图。
如果是常见类型的灰度图像,则横坐标应该是0-255
如果是常见的彩色图像,则每一个相关颜色的图像横坐标范围都是0-255
性质
性质是比较好理解的
- 灰度直方图只能反映图像的灰度分布情况,而不能反映图像像素的位置,即丢失了像素的位置信息。
- 一幅图像对应唯一的灰度直方图,反之不成立。不同的图像可对应相同的直方图。
- 一幅图像分成多个区域,多个区域的直方图之和即为原图像的直方图。
应用
直方图的应用:
用于判断图像量化是否恰当:
用于确定图像二值化的阈值:
主要就是看图像中是否存在两个波峰和一个波谷,如下图所示,就可以以波谷的值作为界限来得到二值化阈值,即大于阈值全当1处理,小于等于阈值当0进行处理。
数字图像处理算法的形式
基本功能形式
单幅图像–>单幅图像
多幅图像–>单幅图像
单(或多)幅图像–>数字或符号等
局部处理
对于卷积运算在简略了解后的总结:总的来说,就是利用一个卷积核,对于原图像的每个像元进行处理,使得计算机最后输出的结果可以达到我们的预期效果(比如对某一种特征有要求,对某一种特征需要忽略)
点处理:
大局处理
迭代处理
跟踪处理
窗口处理和模板处理
图像的数据结构和文件格式
图像的数据结构:
图像数据结构是指图像像素灰度值的存储方式,常用方式是将图像各象素灰度值用一维或二维数组相应的各元素加以存储。其存储方式有以下几种:组合方式、比特面方式、分层结构、树结构、多重图像数据存储
组合方式
方法:一个字长存放多个像素灰度值。
特点:节省内存,但计算量增加,处理程序复杂。
很少使用
比特面方式
将所有像素灰度的相同比特位用一个二维数组表示,形成比特面。n个比特位表示的灰度图像按比特面方式存取,就得到n个比特面。
特点:能充分利用内存空间,便于进行比特面之间的运算,但对灰度图像处理耗时多。
分层结构
优点:先对低分辨率图像进行处理,然后根据需要对高分辨率图像进行处理,可提高效率。
树结构
对一幅二值图像的行、列接连不断地二等分,如果图像被分割部分中的全体像素都变成具有相同的特征时,这一部分则不再分割。
用这种方法,可以把图像用树结构(4叉树)表示。这可以用在特征提取和信息压缩等方面。
多重图像数据存储
对于彩色图像或多波段图像而言,每个像素包含着多个波段的信息。
存储方式有三种:(这里暂时还不明白)
①逐波段存储,分波段处理时采用。
②逐行存储,逐行扫描记录设备采用。
③逐像素存储,用于分类。
图像文件格式
按不同的方式进行组织或存储数字图像像素的灰度,就得到不同格式的图像文件。图像文件按其格式的不同具有相应的扩展名。(RAW/BMP/TGA/PCX/GIF/TIFF)
特征:
1、描逑图像的高度、宽度以及各种物理特征的数据。
2、彩色定义
3、描述图像的位图数据体
位图数据:
两种情况:
对于用到调色板的位图,图像数据就是该像素颜色在调色板
中的索引值;
对于真彩色图,图像数据就是实际的R、G、B值。
而对于256色位图,一个字节刚好表示一个像素
GIF图像
GIF图像是基于颜色列表的,最多支持8位。GIF支持在一幅GIF文件中存放多幅彩色图像,并且可以按照一定的顺序和时间间隔将多幅图像依次读出并显示在屏幕上,这样就可以形成一种简单的动画效果。
图像的特征与噪声
一共分为以下三类:
图像的特征类别
特征提取与特征空间
图像噪声
图像的特征类别
按提取特征的范围大小又可以分为:点特征、局部特征、区域特征、整体特征
特征提取与特征空间
1.特征提取
获取图像特征信息的操作称作特征提取。
它作为模式识别、图像理解或信息量压缩的基础是很重要的。通过特征提取,可以获得特征构成的图像(称作特征图像)和特征参数。
2.特征空间
把从图像提取的m个特征量 y1,y2,…ym,用m维的向量Y=[y1,y2, ……ym]^t表示称为特征向量。另外,对应于各特征量的m维空间叫做特征空间。