数据结构:数据结构是一门研究非数值计算的程序设计问题中计算机的操作对象以及它们之间的关系和操作等的学科。
基本概念与术语:
数据:是对客观事物的符号表示,在计算机科学中是指所有能输入到计算机中并被计算机程序处理的符号的总称。
数据元素:是数据的基本单位,在计算机程序中通常作为一个整体进行考虑和处理。一个数据元素可由若干个数据项组成。
数据项:数据的不可分割的最小单位。
数据对象:是性质相同的数据元素的集合,是数据的子集。
数据结构:相互之间存在一定关系的数据元素的集合。按照视点的不同,数据结构分为逻辑结构和存储结构。
逻辑结构:指数据元素之间逻辑关系的整体。
数据的逻辑结构是从具体问题抽象出来的数据模型
存储结构:又称为物理结构,是数据及其逻辑结构在计算机中的表示。
数据结构从逻辑上分为四类:
⑴ 集合:数据元素之间就是
“属于同一个集合” ;
⑵ 线性结构:数据元素之间
存在着一对一的线性关系;
⑶ 树结构:数据元素之间存在
着一个对多个的关系
⑷ 图结构:数据元素之间存在
着多个对多的个任意关系。
两种存储结构:
1. 顺序存储结构:用一组连续的存储单元依次存储数据元素,数据元素之间的逻辑关系由元素的存储位置来表示。
2. 链接存储结构:用一组任意的存储单元存储数据元素,数据元素之间的逻辑关系用指针来表示 。
逻辑结构和存储结构之间的关系
数据的逻辑结构属于用户视图,是面向问题的,反映了数据内部的构成方式;数据的存储结构属于具体实现的视图,是面向计算机的。
抽象数据类型
. 数据类型(Data Type):一组值的集合以及定义于这个值集上的一组操作的总称。
例如:C语言中的整型变量,其值集为某个区间上的整数(区间大小依赖不同的机器,定义在其上的操作为加减乘除取模等算术运算)
2. 抽象(Abstract):抽出问题本质的特征而忽略非本质的细节。
例如: 地图、驾驶汽车
3. 抽象数据类型(Abstract Data Type,ADT):一个数据结构以及定义在该结构上的一组操作的总称。
算法及算法分析
算法:是对特定问题求解步骤的一种描述,是指令的有限序列。
算法的五大特性:
⑴输入:一个算法有零个或多个输入。
⑵ 输出:一个算法有一个或多个输出。
⑶ 有穷性:一个算法必须总是在执行有穷步之后结束,且每一步都在有穷时间内完成。
⑷ 确定性:算法中的每一条指令必须有确切的含义,对于相同的输入只能得到相同的输出。
⑸ 可行性:算法描述的操作可以通过已经实现的基本操作执行有限次来实现。
算法的描述方法
自然语言
优点:容易理解
缺点:冗长、二义性
使用方法:粗线条描述算法思想
注意事项:避免写成自然段
流程图
优点:流程直观
缺点:缺少严密性、灵活性
使用方法:描述简单算法
注意事项:注意抽象层次
程序设计语言
优点:能由计算机执行
缺点:抽象性差,对语言要求高
使用方法:算法需要验证
注意事项:将算法写成子函数
伪代码
伪代码:介于自然语言和程序设计语言之间的方法,它采用某一程序设计语言的基本语法,操作指令可以结合自然语言来设计。
优点:表达能力强,抽象性强,容易理解
算法分析--度量算法效率的方法:
缺点:⑴ 编写程序实现算法将花费较多的时间和精力;
⑵ 所得实验结果依赖于计算机的软硬件等环境因素。
算法分析:对算法所需要的计算机资源——时间和空间进行估算。
时间复杂性 空间复杂性
问题规模:输入量的多少。
基本语句:是执行次数与整个算法的执行次数成正比的操作指令。
定理:若A(n)=amnm+am-1nm-1+¼+a1n+a0是一个m次多项式,则A(n)=O(nm)。
说明:在计算算法时间复杂度时,可以忽略所有低次幂和最高次幂的系数。
Ο(1)<(log2n)<(n)<(nlog2n)<(n2)<(n3)<…<(2n)<(n!)
结论:如果问题规模相同,时间代价与输入数据有关,则需要分析最好情况、最坏情况、平均情况。