(一)1. 数据结构的基本概念
数据
数据是信息的载体,是对客观事物的符号表示,在计算机科学中是指所有能输入到计算机中并被计算机程序处理的符号的总称。是计算机程序加工的原料。
说明:计算机只能识别和处理0和1,所以这些符号最终会被存储为0和1的形式。
数据元素、数据项
-
数据元素是数据的基本单位,通常作为一个整体进行考虑和处理。
-
一个数据元素可由若干数据项组成,数据项是构成数据元素的不可分割的最小单位。
数据对象、数据结构
-
数据对象是具有相同性质的数据元素的集合,是数据的一个子集。
-
数据结构是相互之间存在一种或多种特定关系的数据元素的集合。
同样的数据元素,可组成不同的数据结构。
不同的数据元素,可组成相同的数据结构。
数据结构着重关注的是数据元素之间的关系,和对这些数据元素的操作,而不关心具体的数据项内容。
2. 数据结构
说明:逻辑结构和数据的运算定义一种数据结构。而物理结构(存储结构)表示如何用计算机来实现这种数据结构。
链式存储、索引存储、散列存储是非顺序存储。
逻辑结构
-
集合结构
各个元素同属一个集合,别无其他关系。
-
线性结构
数据元素之间是一对一的关系。
除了第一个元素,所有元素都有唯一前驱;除了最后一个元素,所有元素都有唯一后继。
-
树形结构
数据元素之间是—对多的关系。
-
图结构
数据元素之间是多对多的关系。
数据的运算
结合逻辑结构、实际需求来定义基本运算。
基本运算包括:增、删、改、查。
数据的存储结构
1. 顺序存储:把逻辑上相邻的元素存储在物理位置上也相邻的存储单元中,元素之间的关系由存储单元的邻接关系来体现。
2. 链式存储。逻辑上相邻的元素在物理位置上可以不相邻,借助指示元素存储地址的指针来表示元素之间的逻辑关系。
3. 索引存储。在存储元素信息的同时,还建立附加的索引表。索引表中的每项称为索引项,索引项的一般形式是(关键字,地址)。
4. 散列存储。根据元素的关键字直接计算出该元素的存储地址,又称哈希(Hash)存储。
3. 数据结构的三要素
-
若采用顺序存储,则各个数据元素在物理上必须是连续的;若采用非顺序存储,则各个数据元素在物理上可以是离散的。
-
数据的存储结构会影响存储空间分配的方便程度。
-
数据的存储结构会影响对数据运算的速度。
运算的定义是针对逻辑结构的,指出运算的功能;
运算的实现是针对存储结构的,指出运算的具体操作步骤。
4. 数据类型、抽象数据类型
数据类型
数据类型是一个值的集合和定义在此集合上的一组操作的总称。
1)原子类型。其值不可再分的数据类型。
2)结构类型。其值可以再分解为若干成分(分量)的数据类型。
说明:典型的结构类型为结构体。
5. 小结
(二)1. 算法的基本概念
2. 什么是算法?
算法(Algorithm)是对特定问题求解步骤的一种描述,它是指令的有限序列,其中的每条指令表示一个或多个操作。
程序=数据结构+算法
数据结构:解决如何用数据正确地描述现实世界的问题,并存入计算机。
算法:解决如何高效地处理这些数据,以解决实际问题,简言之就是求解问题的具体步骤。
在这个示例中,食材好比数据,步骤好比算法,通过算法将数据进行处理,解决了番茄炒蛋的问题。
3. 算法的特性
有穷性
一个算法必须总在执行有穷步之后结束,且每一步都可在有穷时间内完成。
注:算法必须是有穷的,用有限步骤解决某个特定问题。而程序可以是无穷的,例如微信。
确定性
算法中每条指令必须有确切的含义,对于相同的输入只能得出相同的输出。
可行性
算法中描述的操作都可以通过已经实现的基本运算执行有限次来实现。
输入
一个算法有零个或多个输入,这些输入取自于某个特定的对象的集合。
输出
一个算法有一个或多个输出,这些输出是与输入有着某种特定关系的量。
4. 好算法的特质
正确性
算法能够正确地解决求解问题。
可读性
算法应具有良好的可读性,以帮助人们理解。
注:算法可以用代码、伪代码描述,甚至用文字描述,重要的是要“无歧义”地描述出解决问题的步骤。
健壮性
输入非法数据时,算法能适当地作出反应或进行处理,而不会产生莫名其妙的输出结果。
高效性与低存储需求
花的时间少。时间复杂度低。
不费内存。空间复杂度低。
注:时间复杂度与空间复杂度往往作为算法效率的度量,来衡量算法的好坏。
5. 小结
(三)时间复杂度
1. 算法效率的度量
2. 时间复杂度
时间复杂度是指算法中所有语句的频度(执行次数)之和。记为:
T(n)=O(f(n))
其中,n是问题的规模;f(n)是问题规模n的某个函数。(T为“time”的意思。)
随着问题规模n的增大,算法执行时间的增长率和f(n)的增长率相同(正相关)。
运算规则
-
加法规则
多项相加,只保留最高阶的项,且系数变为1。
-
乘法规则
多项相乘,都保留。
注意
实际使用中,我们只关注循环的部分,用循环的部分来判断时间复杂度。
-
顺序执行的代码只会影响常数项,可以忽略。
-
只需挑循环中的一个基本操作分析它的执行次数与n的关系即可。
-
如果有多层循环嵌套,只需关注最深层循环的循环次数。
-
时间复杂度计算忽略高阶项系数和低阶项。
常见的时间复杂度
最高阶数越小,
记忆口诀:常对幂指阶。