图像处理书籍笔记1--图像基本数据结构

原创 2016年08月28日 16:29:18

计算机视觉的目的是寻找输入图像与真实世界之间的关系。由原始图像向模型的转换过程,图像信息逐渐压缩。在输入图像和模型之间,定义若干层次的视觉信息表示,计算机视觉由以下设计所组成:

1.中间表示(数据结构)。

2.创建这些中间表示所用的算法和它们之间关系的导入(算法)。

中间层一般可以表示成四个层次。按照从处于低层次抽象的信号开始到人能够感知的描述的顺序排列。

第一层:最低层的表示,称为图标图像,有原始的像素亮度数据的整数矩阵构成。为了后续图像处理,需要进行预处理(如:滤波或边缘锐化)

第二层:分割图像,图像被分割为可能属于同一物体的区域。

第三层:几何表示,保存2D和3D形状知识。例如,在做普通而复杂的有关实际物体受光照和运动影响的模拟时,几何表示是有用的。

第四层:图像数据表示的关系模型。涉及AI技术,利用一些先验知识,从图像中获得的信息可以表示成语义网络或框架。

传统图像图像数据结构

传统的数据结构有矩阵、链、图、物体属性表、关系数据库,这不仅直接表示图像重要的信息,而且还是更复杂的图像分层表示方法的基础。

矩阵:低层图像表示的最普通的数据结构,矩阵是图像的一个完整表示,与图像数据的内容无关,它隐含这图像组成部分之间的空间关系,这些图像组成部分在语义上具有重要性。在图像中,一个很重要的空间关系是相邻关系。矩阵中有大量的图像数据,因此需要大量的空间,因此如果首先从原始的图像矩阵得出全局信息,可以使算法上加速。两个比较好的全局信息的例子:直方图(一个图像的像素具有某个亮度的概率统计),共生矩阵(具有描述纹理的能力)。

            积分图像是另一种能够描述全局信息的矩阵表示方法。积分图像的构造方式是位置(i,j)处的值ii(i,j)是原图像(i,j)左上角所有像素的和。计算多个尺度的简单矩形图像特征,能够快速的在目标识别和目标跟踪上。

链:在计算机视觉中用于描述物体的边界。链适合组织成符号序列的数据,链中相邻的符号通常对应于图像中邻接的基元。有两种常用的编码方式:链码和行程编码。

拓扑数据结构:将图像描述成一组元素及其相互关系,这些关系通常用图结构来表示。区域图和区域邻接图。

关系结构: 关系数据库也可以用来表示从图像中得到的信息。

分层数据结构  ——  由于计算机视觉需要巨大的数据量,分层数据结构使一些特殊算法成为可能,这些算法在相对小的数据量的基础上决定处理策略。

金字塔:最简单的分层数据结构,有两种:M型金字塔(矩阵型金字塔)和T型金字塔(树形金字塔)。


版权声明:本文为博主原创文章,未经博主允许不得转载。

相关文章推荐

归并排序

归并排序算法可以递归地描述为:算法将数组分为两半,对每部分递归地应用归并排序。 下图演示了对由8个元素(2 9 5 4 8 1 6 7)构成的数组进行的归并排序。原始数组分为 (2 9 5 4)和...

图像编程学习笔记2——bmp位图平移

以下文字内容copy于>,code为自己实现,是win32控制台程序。 2.1 平移 平移(translation)变换大概是几何变换中最简单的一种了。 如图2.1所示,初始坐标为(x0,y...

XLS

#!/usr/bin/perl -w#function:            select records from table and print to Excel file#autho...
  • ATGC
  • ATGC
  • 2006-10-31 21:53
  • 725

图像编程学习笔记1——bmp文件结构处理与显示

文本内容转载自《数字图像处理编程入门》,代码为自己实现 1.1图和调色板的概念 如今Windows(3.x以及95,98,NT)系列已经成为绝大多数用户使用的操作系统,它比DOS成功的一个重要...

ubuntu下perl脚本

运行方式 perl  *.pl

数据结构及算法综述

1 数据 序号 名称 定义 举例 1 数据 对客观事物的符号表示,在计算机中就是能被识别的符号集合 数值、图片、视频、音频等形式 2 数据项 数据中具有独立含...

HDU1007 查找平面最近点对

求点集中的最近点对有以下两种方法: 设p1=(x1, y1), p2=(x2, y2), …, pn=(xn, yn)是平面上n个点构成的集合S,设计算法找出集合S中距离最近的点对。  OJ题...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:深度学习:神经网络中的前向传播和反向传播算法推导
举报原因:
原因补充:

(最多只允许输入30个字)