绪论
§1.1 引言
严版教材上没有明确的引言部分,在第一节前有一小段文字,大概叙述了一下“数据结构”的形成和发展背景:计算机应用不再仅仅局限于科学计算,而更多地用于处理控制、管理及数据处理等非数值计算工作。与此相应,计算机加工处理的对象由纯粹的数值发展到字符、表格和图像等具有一定结构的数据。编写一个“好”的程序,必须分析待处理对象的特征以及各处理对象之间存在的关系。
§1.2 什么是数据结构
简单来说,数据结构是一门研究关于非数值计算的程序设计问题中,计算机的操作对象以及它们之间的关系和操作的学科。
§1.3 相关基本概念和术语
数据:客观事物的符号表示,所有能输入计算机并被计算机处理的符号的总称。比如字符串,整数,实数等。
数据元素:数据的基本单位,在计算机中通常作为一个整体处理。一个数据元素可由若干个数据项组成,例如一本书的书目信息就是一个数据元素,书目信息中的每一项(书名、作者名等)就是数据项。
数据对象:性质相同的数据元素的集合,是数据的一个子集。如字符数据对象是集合C={‘A’,‘B’,…,‘Z’}。
数据结构:相互之间存在一种或多种特定关系的数据元素的集合(严版教材解释)。数据元素之间并不孤立存在,它们之间存在的相互关系称为结构。根据关系的不同,可分为四种基本结构:(1)集合(2)线性结构(3)树形结构(4)图状结构或网状结构
D a t a S t r u c t u r e = ( D , S ) Data Structure = (D,S) DataStructure=(D,S)
其中,D为数据元素的有限集,S是D上关系的有限集。比如一个复数可以看作是一个数据结构,集合D包含两个实数d1,d2,集合S包含一种关系P,即d1对应于复数的实部,d2对应于复数的虚部。
逻辑结构:结构定义中“关系”的描述是数据元素之间的逻辑关系,因此又称为逻辑结构。
物理结构(又称存储结构):数据结构在计算机中的表示(映像)。包含数据元素的表示和关系的表示。
计算机中表示信息的最小单位为位(bit),若干位组合形成一个位串表示一个数据元素,通常称这个位串为元素(element)或结点(node)。数据元素由若干数据项组成时,数据相对应的子位串称为数据域。
顺序存储结构:元素在存储器中的相对位置来表示数据元素之间的逻辑关系。
链式存储结构:借助指示元素存储地址的指针(pointer)表示元素之间的逻辑关系。算法的设计取决于选定的逻辑结构,算法的实现依赖于采用的存储结构。
原子类型:数据类型的一种,不可再分,如C语言中的基本数据类型(整型、实型、字符型等)。
结构类型:由若干成分按某种结构组成,可分解,成分可以是结构的,也可以是非结构的。
抽象数据类型(ADT):一个数学模型以及定义在该模型上的一组操作。
ADT 抽象数据类型名{
数据对象:{数据对象定义}
数据关系:{数据关系定义}
基本操作:{基本操作定义}
}ADT 抽象数据类型名
基本操作名 (参数表)
初始条件:{初始条件描述}
操作结果:{操作结果描述}
§1.4 算法的基本特征
算法(algorithm)是对特定问题求解步骤的一种描述,是指令的有限序列,每一个指令代表一个或多个操作;此外,算法具有以下五种特征:
1. 有穷性。算法在执行有穷步后结束,每一步执行有穷时间。
2. 确定性。算法的每一条指令必须有确切的含义,不会产生二义性。相同的输入只会得出相同的输出。
3. 可行性。算法描述的操作可通过已经实现的基本操作运算执行有限次来实现。
4. 输入。一个算法有0个或多个输入。
5. 输出。一个算法有一个或多个输出。
§1.5 算法分析相关概念
算法设计的要求:
-
正确性。
-
可读性。
-
健壮性。能自动纠错,返回错误值,中止程序执行。
-
效率与低存储量需求。
算法效率的度量:
- 事后统计的方法:先写好程序,通过计算机内部的计时功能分辨优劣。
- 事前分析估算的方法:一般采用该法。程序所耗时间一般取决于①算法采用的策略②问题的规模③编写程序的语言,一般语言越高级,执行效率越低④编译程序产生的机器代码质量⑤机器执行指令的速度
渐近时间复杂度(时间复杂度):算法中基本操作重复执行次数是问题规模n的某个函数 f ( n ) f(n) f(n),算法的时间度量记作
T ( n ) = O ( f ( n ) ) T(n) = O(f(n)) T(n)=O(f(n))
常见时间复杂度变化图像:
空间复杂度: S ( n ) = O ( f ( n ) ) S(n) = O(f(n)) S(n)=O(f(n))
一般程序执行过程中不需要进行空间分配即为常数次,若需新分配空间大小为n,比如动态分配存储空间,即为O(n)大小。