【考纲的内容】
算法的时间复杂度和空间复杂度
【知识框架】
1.1 数据结构的基本概念
数据结构利用程序代码把现实世界的问题信息化,同时利用计算机高效处理这些信息,从而创造价值。
1.1.1 基本概念和术语
1. 数据
数据是信息的载体,是描述客观事物属性的数,字符,及所有能输入到计算机中并被计算机识别和处理的符号的集合。数据是计算机程序加工的原料。
2. 数据元素
数据元素是数据的基本单位,通常作为一个整体进行考虑和处理。一个数据元素可由若干数据项组成,数据项是构成数据元素的不可分割的最小单位。
要根据实际需求来确定什么是数据元素,什么是数据项。
3. 数据对象
数据对象是具有相同性质的数据元素的集合,是数据的一个子集。
并不强调数据元素之间的关系。
4. 数据类型
数据类型是一个值的集合和定义在此集合上的一组操作的总称。
(1)原子类型。其值不可再分的数据类型
bool 类型,可进行的操作:与,或,非...
int 类型,可进行的操作:加,减,乘,除,模运算..
(2)结构类型。其值可再分解为若干成分的数据类型。
struct Cust{
int num;
int people;
......
}
(3)抽象数据类型。一个数据模型及定义在此数据模型上的一组操作。它通常是对数据的某种抽象,定义了数据的取值范围及其结构形式,以及对数据操作的集合。
抽象数据类型(ADT)是抽象数据的组织及与之相关的操作。定义一个ADT,就是定义了数据的逻辑结构,数据的运算,也就是定义了一个数据结构。
5. 数据结构
数据结构是指相互之间存在一种或多种特定关系的数据元素的集合。
1.1.2 数据结构的三要素
1. 数据的逻辑结构
逻辑结构是指数据元素之间的逻辑关系,即从逻辑关系上描述数据。它与数据的存储无关,是独立于计算机的。
2. 数据的存储结构
利用计算机表示数据结构的逻辑关系
存储结构是指数据结构在计算机中的表示 (又称映像),也称物理结构。数据的存储结构是用计算机语言实现的逻辑结构,它依赖于计算机语言。
数据的存储结构主要由 顺序存储,链式存储,索引存储,散列存储。
顺序存储:把逻辑上相邻的元素存储在物理位置上也相邻的存储单元中。元素之间的关系是由存储单元的邻接关系来体现。
链式存储:借助指示元素存储地址的指针来表示元素之间的逻辑关系。
索引存储:在存储元素信息的同时,还建立附加的索引表。索引表中的每项称为索引项,索引项的一般形式(关键字,地址)
关键字:可以用来区分不同的数据元素的数据项。
比如海底捞的例子:每一波顾客所取的排队的号都是唯一的,所以海底捞排队系统可以将号码作为数据元素的关键字。
散列存储:根据元素的关键字直接计算出该元素的存储地址,又称哈希(Hash)存储。
3. 数据的运算
施加在数据上的运算包括数据的定义和实现。数据的定义是针对逻辑结构的,指出运算的功能。数据的实现是针对存储结构的,指出运算的具体操作步骤。
根据数据的逻辑结构来定义需要对这些数据进行哪些操作和运算。
单元总结
1 采用顺序存储,各个元素在物理上必须连续,若采用非顺序存储,各个元素在物理上可以是离散的。
2 数据的存储结构会影响存储空间分配的方便程度,数据的存储结构会影响数据运算的速度。
3 确定了一种存储结构就意味着在计算机中表示出了数据的逻辑结果,存储结构的不同,也会导致运算的具体实现不同,确定了存储结构,才能实现数据结构。
1.2 算法和算法的评价
1.2.1 算法的基本概念
算法是对特定问题求解步骤的一种描述,它是指令的有限序列,其中的每条指令表示一个或多个操作。
算法必须是有穷的,而程序可以是无穷的。
微信是程序,而不是算法。打开后可以无穷无尽的运行下去。
![](https://img-blog.csdnimg.cn/direct/7bfa316934474245b9bf2d3b0ee792e5.png)
算法的五个特性:
有穷性:一个算法必须总在执行有穷步后结束,且每一步都可在有穷时间内完成
确定性:算法中每条指令必须有确定的含义,对于相同的输入只能有相同的输出。
可行性:算法中描述的操作都可以通过已经实现的基本运算执行有限次来实现。给出的方案都可以通过计算机来实现
输入:一个算法有零个或多个输入。这些输入取定某个特定的对象的集合。
输出:一个算法有一个或多个输出。这些输出是与输入有着某种特定关系的量。算法必须有结果
好算法的性质:
正确性:算法应该能够正确地解决求解问题。
可能性:算法应具体良好的可读性,以帮助人们理解。
健壮性:算法能对输入的非法数据做出反应或处理,而不会产生莫名其妙的输出。
高效率与低存储量需求:效率是指算法执行的时间,存储量需求是指算法执行过程中所需要的最大存储空间,这两者都与问题的规模有关。
高效率是指花的时间少,时间复杂度低。
低存储量需求是指不费内存,空间复杂度低。
1.2.2 算法效率的度量
1. 时间复杂度
事后统计运行的时间,存在什么问题?
· 和机器性能有关,如:超级计算机vs单片机
· 和编程语言有关,越高级的语言执行效率越低。
· 和指令质量有关。
· 有些算法是不能事后统计的,如:导弹控制算法。
能否排除与算法本身无关的外界因素?
如何评估算法的是时间开销?
算法中所有语句的频度之和即为T(n)。时间预估算法时间开销
逐步递增型爱你
void loveyou(int n){
//n代表问题规模
int i=1;// 1
while(i<=n){//2
i++;//3
printf("I love you %d\n",i);//4
}
printf("I love you More than %d\n",n);//5
}
//默认12345执行所花费的时间是相等的
语句频度:
n=3000时:
1 1
2 3001
34 3000
5 1(执行次数)
T(n)=1+3001+3000*2+1
T(n)=3n+3
当时间复杂度的表达式变复杂的时候,很难去探讨算法的好坏,是否可以忽略表达式的某些部分?
忽略低阶,只看高阶,不看系数
T(n)=3n+3~n
T(n)=O(n)
一般来说我们只会度量一个算法的最坏时间复杂度以及平均时间复杂度。
最坏时间复杂度:指在最坏情况下算法的时间复杂度。
平均时间复杂度:指所有可能输入实例在等概率出现的情况下,算法的期望运行时间。
最好时间复杂度:指在最好的情况下,算法的时间复杂度。
2. 空间复杂度
无论问题规模怎么变,算法所需内存空间都是固定的常量。