文章目录
引例
早期人们都把计算机理解为数值计算工具,就是感觉计算机当然是用来计算的,所以计算机解决问题,应该是先从具体问题中抽象出一个适当的数据模型,设计出一个了解此数据模型的算法,让后编写程序,得到一个实际的软件。
现实中,我们更多的不是解决数值计算的问题,而是需要一些更科学有效的手段(表、树、图)的帮助,才能更好的处理问题。所以,数据结构是一门研究非数值计算的程序设计问题中的抽象操作对象,以及他们之间的关系和操作等相关问题的学科。
程序设计 = 数据结构 + 算法
一、基本概念和术语
1.1 数据
定义:是描述客观事物的符号,是计算机中可以操作的对象,是能被计算机识别,并输入给计算机处理的符号集合。
也就是说:这里的数据就是符号,但这些符号必须有两个前提:
- 可以输入到计算机中
- 能被计算机程序处理
数据不仅仅包含整形、浮点型、字符串等还包括声音、图像、视频等。而声音、图像、视频可已通过编码的手段变成字符数据进行处理。
1.2 数据元素
定义:组成数据的、有一定意义的基本单位,在计算机中通常作为整体处理,也被称为记录。
例:在人类中,人就是数据元素
1.3 数据项
定义:一个数据元素可以有若干个数据项组成。
例:在人这样的数据元素中,姓名、年龄、性别、高矮胖瘦等就是数据项
而具体由什么数据项,就要依据系统需要什么来觉定。
数据项是数据不可分割的最小单位。但数据元素才是数据结构中建立数据模型的着眼点。
就像讨论电影时,讨论的是电影中的人物角色(数据元素),而不是年龄、性别(数据项)
1.4 数据结构
定义:是相互之间存在一种或多种特定关系的数据元素的集合
结构,简单的说就是关系,严格的说是指组成各个部分相互搭配和排列的顺序的方式。
-
在现实生活中,不同的数据元素之间不是独立的,而是存在特定的关系,我们将这些关系称为结构。
-
在计算机中,数据元素并不是孤立的、杂乱无章的,而是具有内在的了联系的数据集合。数据元素之间存在一种或多种特定关系,这也是数据的组织形式。
而这一种或多种的关系就是以下要讨论的话题。
二、逻辑结构、物理结构以及操作
按照视角不同,我们把数据结构分为逻辑结构和物理结构
2.1 逻辑结构
定义:是指数据对象中数据元素之间的相互关系。
逻辑结构可以分为以下四种:
- 集合结构
- 线性结构
- 树状结构
- 图像结构
1、集合机构:数据元素除了同属于一个集合外,他们之间没有其他关系。各个数据元素“平等”的,他们的共同属性是“同属于一个集合”。数据结构中的集合关系类似于数学中的集合。
2、线性结构:数据元素之间是一对一的关系
3、树状结构:数据元素之间存在一对多的层次关系。
4、图状结构:数据元素之间是多对多的关系。
我们在用示意图表示数据结构时,注意两点:
- 将每一个数据元素看做一个节点,用圆圈表示。
- 原属之间的逻辑关系用节点之间的连线表示,如果这个关系是有方向的,那么用带箭头的连线表示
2.2 物理结构
定义:数据的逻辑结构在计算机中的存储形式
存储结构可以分为以下两种:
- 顺序存储结构
- 链式存储结构
1、顺序存储结构:数据元素存放在地址连续的存储单位里,其数据间的逻辑关系和物理关系是一致的。
在计算机中,数组就是这样的结构。
而结构时刻都在变化中,显然顺序存储结构是不科学的,于是,就有了以下存储结构。
2、链式存储结构:数据元素存放在任意的存储单元里,这样的存储单元可以是连续的,也可以是不连续的。
如图,这样的存储关系不能反映其逻辑关系。因此需要用一个指针存放数据元素的地址,这样通过地址就可以找到存在某种关系的数据元素的位置。
逻辑结构是面向问题的,而物理结构是面向计算机的
2.2 操作
三、数据类型、抽象数据类型
3.1 数据类型
定义:一组性质相同的值的集合及定义在此集合上的一些操作的总称。
数据类型是按照值的不同进项划分的。在高级语言中,每个变量、常量和表达式都有各自的取值范围。类型就用来说明变量或表达式的取值范围和所能进行的操作。
在C语言中,按照取值的不同,数据类型可以分为两类:
- 原子类型:是不可以再分解的基本类型,包括整型、实型、字符型等。
- 结构类型:有若干个类型组合而成,是可以再分解的。例如,整型数组是由若干整型数据组合成的。
而高级语言开发者,为了实现两个整型数值的相加时,不用考虑1 + 2在CPU中如何实现的,这些对于高级语言开发者来讲根部不重要。面对这些问题的时候,我们就考虑把它们抽象出来。
3.2 抽象数据类型(Abstract Data Typr, ADT)
引:抽象是指抽取出事物具有的普遍性的本质。 它时抽出问题的特征而忽略非本质的细节,是对具体事物的一个概括。抽象是一种思考问题的方式,它隐藏了繁杂的细节,只保留实现目标所必须的信息。
定义:指一个数学模型及定义在该模型上的一组操作。
抽象数据类型的定义仅取决于它的一组逻辑特性(整型加法在数学上就是统一的),而与其在计算机内部(整型加法可能就不相同了)如何表示和实现无关。
“抽象”的意义在于数据类型的数学抽象特性。