第一章 数据结构绪论
数据:是描述客观事物的符号,是计算机中可以操作的对象,是能被计算机识别,并输入给计算机处理的符号集合。
-
数据元素:是组成数据的、有一定意义的基本单位,在计算机中通常作为整体处理。也被称为记录。
-
数据项:一个数据元素可以由若干个数据项组成。
数据项是数据不可分割的最小单位。 -
数据对象:是性质相同的数据元素的集合,是数据的子集。
-
数据结构:是相互之间存在一种或多种特定关系的数据元素的集合。
关系示意图
- 逻辑结构:是指数据对象中数据元素之间的相互关系。
- 集合结构
- 线性结构 —— 一对一
- 树形结构 —— 一对多
- 图形结构 —— 多对多
- 物理结构:是指数据的逻辑结构在计算机中的存储形式。
- 顺序存储结构
顺序存储结构:是把数据元素存放在地址连续的存储单元里,其数据间的逻辑关系和物理关系是一致的。 - 链式存储结构
链式存储结构:是把数据存储在任意的存储单元里,这组存储单元可以是连续的,也可以是不连续的。
-
数据类型:是指一组性质相同的值的集合及定义在此集合上的一些操作的总称。
-
在C语言中,按照取值的不同,数据类型可以分为两类:
- 原子类型:是不可以再分解的基本类型,包括整型、实型、字符型等。
- 结构类型:由若干个类型组合而成,是可以再分解的。例如,整形数组是由若干整型数据组成的。
-
抽象数据类型(ADT):是指一个数学模型及定义在该模型上的一组操作。
标准格式:ADT 抽象数据类型名 Data 数据元素之间逻辑关系的定义 Operation 操作1 初始条件 操作结果描述 操作2 …… 操作n …… endADT
第二章 算法
-
算法是解决特定问题求解步骤的描述,在计算机中表现为指令的有限序列,并且每条指令表示一个或多个操作
-
算法的特性
输入:算法具有零个或多个输入。
输出:算法至少有一个或多个输出。
有穷性:指算法在执行有限的步骤之后,自动结束而不会出现无限循环,并且每一个步骤在可接受的时间内完成。
确定性:算法的每一步骤都具有确定的含义,不会出现二义性。
可行性:算法的每一步都必须是可行的,也就是每一步都能通过执行有限次数完成。 -
算法设计的要求:正确性、可读性、健壮性、时间效率高和存储量低
-
算法效率的度量方法
事后统计方法(不科学、不准确)
事前分析估计方法√ -
函数的渐近增长:给定两个函数 f(n) 和 g(n),如果存在一个整数 N,使得对于所有的 n>N,f(n) 总是比 g(n) 大,那么我们说 f(n) 的增长渐近快于 g(n)。
-
算法的时间复杂度
在进行算法分析时,语句总的执行次数 T(n) 是关于问题规模n的函数,进而分析T(n)随n的变化情况并确定 T(n) 的数量级。算法的时间复杂度,也就是算法的时间量度,记作:T(n) = O(f(n))。它表示随问题规模 n 的增大,算法执行时间的增长率和 f(n) 的增长率相同,称作算法的渐进时间复杂度,简称为时间复杂度。其中f(n)是问题规模n的某个函数。 -
推导大O阶方法:
- 用常数1取代运行时间中的所有加法常数
- 在修改后的运行次数函数中,只保留最高阶项
- 如果最高阶项存在且不是1,则去除与这个项相乘的常数。
常数阶、线性阶、对数阶、平方阶
- 常用的时间复杂度耗费时间排序:
O(1) < O(logn) < O(n) < O(nlogn) < O(n²) < O(n³) <O(2n) < O(n!) < O(nn)
一般在没有特殊说明的情况下,都是指最坏时间复杂度。
- 算法的空间复杂度通过计算算法所需的存储空间实现,算法空间复杂度的计算公式记作:S(n) = O(f(n)),其中,n 为问题的规模,f(n) 为语句关于 n 所占存储空间的函数。