1. 1 基本概念和术语
1.1.1 数据
数据:是描述客观事物的符号,是计算机中可以操作的对象,是能被计算机识别,并输入给计算机处理的符号集合。 数据不仅仅包括整型、实型等数值类型,还包括字符及声音、图形、视频等非数值类型。
我们这里说的数据,其实就是符号,而且这些符号必须具备两个前提:
-
可以输入到计算机中。
-
能被计算机程序处理。
对于整形、实型等数值类型,可以进行数值计算。
对于字符数据类型,就需要进行非数值的处理。而声音、图像、视频等其实是可以通过编码的手段编程字符数据来处理的。
1.1.2 数据元素
数据元素:是组成数据的、有一定意义的基本单位,在计算机中通常作为整体处理。也被称为记录。
比如:动物类,狮子、老虎、大象;昆虫类,蝎子、蜻蜓、蜜蜂
1.1.3 数据项
数据项:一个数据元素可以由若干个数据项组成。
比如人这样的数据元素,可以有眼、耳、鼻、嘴、手、脚这些数据项,也可以有姓名、年龄、性别、出生地址、联系电话等数据项,具体有哪些数据项,要视你做的系统来决定。
数据项是数据不可分割的最小单位。 在数据结构这门课程中,我们把数据项定义为最小单位,是有助于我们更好地解决问题。但真正讨论问题时,数据元素才是数据结构中建立数据模型的着眼点。就像我们讨论一部电影时,是讨论这部电影角色这样的"数据元素",而不是针对这角色的姓名或年龄这样的"数据项"去研究分析。
1.1.4 数据对象
数据对象:是性质相同的数据元素的集合,是数据的子集。
什么叫性质相同呢,是指数据元素具有相同数量和类型的数据项,比如:人都有姓名、生日、性别等相同的数据项。
既然数据对象是数据的子集,在实际应用中,处理的数据元素通常具有相同性质,在不产生混淆的情况下,我们都将数据对象简称为数据。
1.1.5 数据结构
结构,简单的理解就是关系,比如分子结构,就是说组成分子的原子之间的排列方式。严格点说,结构是指各个组成部分相互搭配和排列的方式。在现实世界中,不同数据元素之间不是独立的,而是存在特定的关系,我们将这些关系称为结构。
数据结构:是相互之间存在一种或多种特定关系的数据元素的集合。
2.1 逻辑结构与物理结构
2.1.1 逻辑结构
逻辑结构:是指数据对象中数据元素之间的相互关系。
逻辑结构分为以下四种:
- 1、集合结构:集合结构中的数据元素除了同属于一个集合外,它们之间没有其他关系。数据结构中的集合关系就类似于数学中的集合。(如图 1-5-1所示)
- 2、线性结构:线性机构中的数据元素之间是一对一的关系。(如图1-5-2)
-
3、树形结构:树形结构中的数据元素之间存在一种一对多的层次关系。
(如图1-5-3所示)。
- 4、图形结构:图形结构的书元素是多对多的关系。(如图1-5-4所示)
我们在用示意图表示数据的逻辑结构时,要注意两点:
-
将每一个数据元素看做一个结点,用圆圈表示。
-
元素之间的逻辑关系用结点之间的连线表示,如果这个关系是有方向的,那么用带箭头的连线表示。
2.2.1 物理结构
物理结构(有的也叫存储结构):是指数据逻辑结构在计算机中的存储形式。
数据是数据元素的集合,那么根据物理结构的定义,实际上就是如何把数据元素存储到计算机的存储器中,存储器主要是针对内存而言的,像硬盘、软盘、光盘等外部存储器的数据组织通常用文件结构来描述。
数据的存储结构应正确反映数据元素之间的逻辑关系,这才是最为关键的,如何存储数据元素之间的逻辑关系,是实现物理机构的重点和难点。
数据元素的存储结构形式有两种:顺序存储和链式存储。
1. 顺序存储结构
顺序存储结构:是把数据元素存放在地址连续的存储单元里,其数据间的逻辑关系和物理关系是一致的(如图 1-5-5 所示)。
这种存储结构其实很简单,说白了,就是排队占位。大家都按顺序排好,每个人占一小段空间,大家谁也别插谁的队。数组就是这样的顺序存储结构。当你告诉计算机,你要建立一个有9个整型数据的数组时,计算机就在内存中找了片空地,按照一个整型所占位置的大小乘以9,开辟一段连续的空间,于是第一个数组数据就放在第一个位置,第二个数据放在第二个,这样依次摆放。
2. 链式存储结构
如果一切都是这么简单和有规律就好办了,实际上,总会有人插队,也会有人放弃排队。所以这个队伍中会添加新成员,也有可能会去掉老元素,整个结构时刻都处于变化中。对于这种时常要变化的结构,就要用到链式存储。
链式存储结构:是把数据元素存放在任意的存储单元里,这组存储单元可以是连续的,也可以是不连续的。 数据元素的存储关系并不能反映其逻辑关系,因此需要用一个指针存放数据元素的地址,这样通过地址就可以找到相关联数据元素的位置(如图 1-5-6 所示)。
显然,链式存储就灵活多了,数据存在哪里不重要,只要有一个指针存放了相应的地址就能找到它了。
逻辑结构是面向问题的,而物理机构是面向计算机的,其基本的目标就是将数据及其逻辑关系存储到计算机的内存中。
3.1 抽象数据类型
3.1.1 数据类型
数据类型:是指一组性质相同的值的集合及定义在此集合上的一些操作的总称。
数据类型是按照值的不同进行划分的。在高级语言中,每个变量、常量和表达式都有各自的取值范围。类型就用来说明变量或表达式的取值范围和所能进行的操作。
在计算机中,内存不是无限大的,你要计算一个如 1+1=2、3+5=8这样的整型数字的加减乘除运算,显然不需要开辟很大的适合小数甚至字符运算的内存空间。于是计算机的研究者们就考虑,要对数据进行分类,分出来多种数据类型。
抽象是指抽取出事物具有的普遍性的本质。 它是抽出问题的特征而忽略非本质的细节,是对具体事物的一个概括。抽象是一种思考问题的方式,它隐藏了繁杂的细节,只保留实现目标所必需的信息。
3.1.1 抽象数据类型
我们对已有的数据类型进行抽象,就有了抽象数据类型。
抽象数据类型(Abstract Data Type,ADT):是指一个数学模型及定义在该模型上的一组操作。 抽象数据类型的定义仅取决于它的一组逻辑特性,而与其在计算机内部如何表示和实现无关。