4图像分析的数据结构
4.1 图像数据表示的层次
1)计算机视觉设计组成:中间表示(数据结构)+ 创建这些中间表示所用的算法和他们之间的关系的导入
2)中间表示从底层到人能感知的描述分为四个层次:
a.图标图像:像素亮度数据的整数矩阵
b.分割图像:有利于处理噪声和错误图像数据
c.几何表示:保存2D和3D 形状知识
d.关系模型:需要一些有关待解决问题的先验知识
4.2 传统图像数据结构
传统的图像数据结构:矩阵、链、图、物体属性表、关系数据库
4.2.1 矩阵
1)矩阵元素
整型数值,对应于采样栅格中的相应像素的亮度或其他属性。
图像获取设备直接输出。
矩阵中的图像信息可以通过像素坐标得到(行列标号)。
采用数组数据表示矩阵。
矩阵是图像的一个完整表示,与图像数据内容无关,隐含图像组成部分之间的空间关系。
2)全局信息
特点:紧凑,占用空间小。
- 直方图
标准直方图是如下现象的概率密度估计:一个图像的像素具有某个亮度。
- 共生矩阵
亮度为z的像素和亮度为y的像素的具有的空间关系的两个像素的概率估计。
考虑共生矩阵的主要原因是其描述纹理的能力。
- 积分图像
主要用来快速计算多个尺度的简单矩形图像特征。这种特征可以用在快速的目标识别和目标跟踪。
4.2.2 链
1)特点
用于描述物体的边界。
元素是一个基本符号。
链中相邻的符号通常对应图像中邻接的基元
2)链码
定义:常用与描述物体的边界,或者图像中一个像素宽的线条。
边界由参考像素的坐标和一个符号序列来定义,符号对应与几个事先定义好了方向的单位长度的线段。
从链码获取局部信息:系统搜索整个链码。
适合:基于形式语言理论的句法模式识别。
3)行程编码
目的:仅记录图像中属于物体的区域,该区域表示成以表为元素的表。
适合:简单的图像压缩
4.2.3 拓扑数据结构
图结构:描述区域及其邻接关系。
赋值图
区域邻接图
4.2.4 关系结构
用于描述图像区域之间的语义关系。
4.3 分层数据结构
无法使用并行计算。使用知识而不是强力减轻计算负担并提高处理速度。
4.3.1 金字塔
1)M型金字塔(矩阵型金字塔)
适用:对图像的不同分辨率同时进行处理时。分辨率降低一层,数据量减少4倍,处理速度提高约4倍。
2)T型金字塔(树形金字塔)
4.3.2 四叉树
T型金字塔的变种,图像中的选择区域比其他区在更高的分辨率上存储,允许选择性的提取细节。
叶码提供了一种更有效的四叉树形式。