文章目录
第一章 绪论
概览
需要具备的知识C/C++语言
数据结构的基本概念
- 数据
- 数据元素、数据项
- 数据对象、数据结构
数据
- 数据是信息的载体,是描述客观事物属性的树、字符及所有能输入到计算机中并被计算机程序识别和处理的符号的集合,数据是计算机程序加工的原料
现代计算机:经常处理非数值型问题,对于非数值型问题
- 我们关心每个个体的具体信息
- 我们还关心个体之间的关系
数据元素、数据项
- 数据元素,描述一个个体
- 数据元素是数据的基本单位,通常作为一个整体进行考虑和处理。如一个人的财富信息
- 一个数据元素可以由若干数据项组成,数据项是构成数据元素不可分割的最小单位
数据对象是具有相同性质的数据元素的集合,是数据的一个子集
数据结构三要素
逻辑结构
- 集合:各元素同属一个集合,别无其他关系
- 线性结构:数据元素是一对一的关系,除了第一个元素,所有元素都有唯一的前驱,除了最后一个元素,所有元素都有唯一后继
- 树形结构:数据元素之间存在一对多的关系
- 图结构:也叫网状结构,数据元素之间是多对多的关系
基本运算,如
- 查找第i个数据元素
- 在第i个位置插入新的数据元素
- 删除第i个位置的数据元素
数据的物理结构(存储结构):如何用计算机表示数据元素的逻辑关系
以线性结构为例,可以有顺序存储,链式存储,索引存储,散列存储
- 顺序存储:逻辑上相邻的元素存储在物理位置上也相邻的存储单元中,元素之间的关系由存储单元的邻接关系来体现
- 链式存储:逻辑上相邻的元素在物理位置上可以不相邻,借助指示元素存储地址的指针来表示元素之间的逻辑关系
- 索引存储:在存储元素信息的同时,还建立附加的索引表,索引表中的每项成为索引项,索引项的一般形式是(关键字,地址)
存储结构
- 数据的存储结构会影响存储空间分配的方便程度
- 数据的存储结构会影响对数据运算的速度
运算
- 运算的定义是针对逻辑结构的,指出运算的功能
- 运算的实现是针对存储结构的,指出运算的具体操作步骤
数据类型、抽象数据类型
- 数据类型是一个值的集合和定义在此集合上的一组操作的总称
- 原子类型:其值不可再分的数据类型
- 结构类型:其值可以再分解成若干成分(分量)的数据类型
- 抽象数类型ADT:是抽象数据组织及与之相关的操作
什么是算法
- 程序=数据结构+算法
- 算法是对特定问题求解步骤的一种描述,它是指令的有限序列,其中的每条指令表示一个或多个操作
算法特性
- 有穷性:一个算法必须总在有穷步之后结束,且每一步都可以在有穷时间内完成。算法必须是有穷的,程序可以是无穷的。如,微信是程序,不是算法
- 确定性:算法中每条指令必须有确切的含义,对于相同的输入只能得出相同的输出。
- 可行性:算法中描述的操作都可以通过已经实现的基本运算执行有限次来实现
- 输入:一个算法有零个或多个输入,这些输入取自某个特定的对象的集合
- 输出:一个算法有一个或多个输出,这些输出是与输入有着某种特定关系的量
好的算法的特质
- 正确性:正确的解决问题
- 可读性:具有良好的可读性,方便人们理解
- 健壮性:输入非法数据时,算法能适当做出反应或处理,不会产生莫名其妙的输出结果
- 高效率与低存储量需求。高效率指时间复杂度低,低存储量指空间复杂度低。
算法时间复杂度 - 让算法事先运行,事后统计运行时间存在诸多问题,不适宜。
- 算法时间复杂度:事前预估算法的时间开销T(n)与问题规模n的关系
- 思考:表达式千差万别,是否可以忽略某些部分;如果有很多行,是否要一行一行数
简化时间复杂度表达式
- 只保留阶数高的部分,且系数变为1;其实就是求极限,找同阶
- 加法规则:多项相加,只保留最高阶项,且系数变为1
- 乘法规则:多项相乘,合并,结果再保留最高阶项,且系数变为1
- 常见的数量级阶数排序,如图,口诀:常对幂指阶