1.1 数据结构在程序设计中的作用
1.2主要内容
问题-->抽象出问题的模型——>求模型的解
【问题】:数值问题、非数值问题
数值问题——.数学方程
非数值问题——数据问题
非数值问题的数据组织和处理,主要内容如下:
(1)数据的逻辑结构:线性表、树、图等数据结构,其核心是如何组织待处理的数据以及数据之间的关系;
(2)数据的存储结构:如何将线性表、树、图等数据结构存储到计算机的存储器中,其核心是如何有效地存储数据以及数据之间的逻辑关系;
(3)算法:如何基于数据的某种存储结构实现插入、删除、查找等基本操作,其核心是如何有效地处理数据;
(4)常用数据处理技术:查找技术、排序技术、索引技术等。
1.3数据结构的基本概念
数值数据:整数、实数等
非数值数据:图形、图象、声音、文字等
数据结构:相互之间存在一定关系的数据元素的集合。
数据、数据元素、数据项之间的关系
按照视点的不同,数据结构分为逻辑结构和存储结构。
数据的逻辑结构是从具体问题抽象出来的数据模型
数据的逻辑结构在形式上可定义为一个二元组:
Data_Structure = (D, R)
其中 D 是数据元素的有限集合, R 是 D 上关系的集合
Data_Structure = (D, R)
其中D = {A,B,C,D,E,F,G}
R = {R1},R1 = {<A,B>, <A,E>, <A,F>, <B,C>, <B,D>, <C,D>, <D,E>, <D,G>, <E,F>, <E,G>}
存储结构实质上是内存分配,在具体实现时依赖于计算机语言。
数据结构从逻辑上分为四类:
⑴集合:数据元素之间就是“属于同一个集合” ;
⑵线性结构:数据元素之间存在着一对一的线性关系;
⑶树结构:数据元素之间存在着一对多的层次关系;
⑷图结构:数据元素之间存在着多对多的任意关系。
通常有两种存储结构:
1.顺序存储结构:用一组连续的存储单元依次存储数据元素,数据元素之间的逻辑关系由元素的存储位置来表示。
2.链接存储结构:用一组任意的存储单元存储数据元素,数据元素之间的逻辑关系用指针来表示 。
抽象数据类型
1. 数据类型(Data Type):一组值的集合以及定义于这个值集上的一组操作的总称。
例如:C++中的整型变量
2. 抽象(Abstract):抽出问题本质的特征而忽略非本质的细节。
例如:地图、驾驶汽车
3. 抽象数据类型(Abstract Data Type,ADT):一个数据结构以及定义在该结构上的一组操作的总称。
在设计ADT时,把ADT的定义、设计和实现分开来。定义部分只包含数据的逻辑结构和所允许的操作集合,一方面,ADT的使用者依据这些定义来使用ADT,即通过操作集合对该ADT进行操作;另一方面,ADT的实现者依据这些定义来完成该ADT各种操作的具体实现。
ADT 抽象数据类型名
Data
数据元素之间逻辑关系的定义
Operation
操作1
前置条件:执行此操作前数据所必须的状态
输 入:执行此操作所需要的输入
功 能:该操作将完成的功能
输 出:执行该操作后产生的输出
后置条件:执行该操作后数据的状态
操作2
……
……
操作n
……
endADT
1.4 算法及其算法的分析
算法的相关概念
1.算法(Algorithm):是对特定问题求解步骤的一种描述,是指令的有限序列。
2.算法的五大特性:
⑴ 输入:一个算法有零个或多个输入。
⑵输出:一个算法有一个或多个输出。
⑶有穷性:一个算法必须总是在执行有穷步之后结束,且每一步都在有穷时间内完成。
⑷确定性:算法中的每一条指令必须有确切的含义,对于相同的输入只能得到相同的输出。
⑸可行性:算法描述的操作可以通过已经实现的基本操作执行有限次来实现。
算法的四种描述
一、算法的描述方法——自然语言
优点:容易理解
缺点:冗长、二义性
使用方法:粗线条描述算法思想
注意事项:避免写成自然段
二、算法的描述方法——流程图
优点:流程直观
缺点:缺少严密性、灵活性
使用方法:描述简单算法
注意事项:注意抽象层次
三、算法的描述方法——程序设计语言
优点:能由计算机执行
缺点:抽象性差,对语言要求高
使用方法:算法需要验证
注意事项:将算法写成子函数
四、算法的描述方法——伪代码
伪代码(Pseudocode):介于自然语言和程序设计语言之间的方法,它采用某一程序设计语言的基本语法,操作指令可以结合自然语言来设计。
优点:表达能力强,抽象性强,容易理解
使用方法:7 ± 2
算法分析
度量算法效率的方法:
缺点:⑴ 编写程序实现算法将花费较多的时间和精力;
⑵ 所得实验结果依赖于计算机的软硬件等环境因素。
事前分析:对算法所消耗资源的一种估算方法。
算法分析(Algorithm Analysis):对算法所需要的计算机资源——时间和空间进行估算。
时间复杂性(TimeComplexity)
空间复杂性(SpaceComplexity)
算法的时间复杂度分析
问题规模:输入量的多少。
基本语句:是执行次数与整个算法的执行次数成正比的操作指令。
算法分析——大O符号
定义 若存在两个正的常数c和n0,对于任意n≥n0,都有T(n)≤c×f(n),则称T(n)=O(f(n))。
定理:若A(n)=amnm+am-1nm-1+¼+a1n+a0是一个m次多项式,则A(n)=O(nm)。
说明:在计算算法时间复杂度时,可以忽略所有低次幂和最高次幂的系数如果问题规模相同,时间代价与输入数据有关,则需要分析最好情况、最坏情况、平均情况。