1.1 什么是数据结构
1.2 基本概念
-
数据:数据是信息的载体,是描述客观事物属性的数、字符及所有能够输入到计算机中并被计算机程序识别和处理的符号的集合。数据是计算机程序加工的原料。
-
数据元素:数据元素是数据的基本单位,通常作为一个整体进行考虑和处理
-
数据项:一个数据元素可有若干个数据项构成,数据项是构成数据元素不可分割的最小单位
-
数据对象:具有相同性质的数据元素的集合,是数据的一个子集
-
数据类型:是一个值的集合和定义在这个集合上的一组操作的总称
- 原子类型:其值不可再分割的数据类型
- 结构类型:其值可以再分解为若干成分(分量)的数据类型
- 抽象数据类型(ADT, Abstract Data Type):抽象数据组织和与之相关的操作
- ADT通常用(数据对象,数据关系,基本操作)三元组表示,从而构成一个完整的数据结构定义(不是真的数据结构)
- 定义一个ADT就是在“定义”一种数据结构,其中ADT的使用者(用户)只需要了解该ADT的逻辑结构和运算操作,而ADT的实现者需要确定该ADT的存储结构才能实现它
-
数据结构:是相互之间存在一种或多种特定关系的数据元素的集合
-
结构:在任何问题中,数据元素不是孤立存在的,它们之间存在某种关系,这种数据元素之间的关系称为结构
一个数据元素通常用于描述一个个体,而数据项则是对个体的具体描述
数据结构关注数据元素之间的关系,和对这些数据元素的操作,而不关心具体的数据项内容
1.3 数据结构的三要素
- 逻辑结构:指数据元素之间的逻辑关系,即从逻辑上描述数据,它与数据的存储无关,是独立于计算机的
- 集合结构(非线性结构):各个元素同属于一个集合,别无其它关系
- 线性结构(线性结构):指数据元素之间是一对一的关系,除了第一个元素之外,每一个元素都有唯一前驱,除了最后一个元素之外,所有元素都有唯一后继
- 树形结构(非线性结构):元素之间的关系是一对多的关系
- 图状结构(非线性结构):元素之间的关系是多对多的关系
- 数据的运算:施加在数据上的运算包括运算的定义和实现
- 运算的定义:针对逻辑结构,指出运算的功能
- 结合逻辑结构和实际需求来定义基本运算
- 实现:针对存储结构,指出运算的具体步骤
- 运算的定义:针对逻辑结构,指出运算的功能
- 物理结构(存储结构):指数据结构在计算机中的表示(映像),即如何用计算机表示数据元素之间的逻辑关系(数据元素的表示+关系的表示)
- 顺序存储:把逻辑上相邻的数据元素存储到物理上也相邻的存储单元中
- 存储单元之间的邻接关系体现逻辑上的关系
- 优点:实现随机存储,每个元素占用最少的存储空间
- 缺点:只能使用相邻的一整块存储空间,容易产生较多的外部碎片
- 链式存储:不要求逻辑上相邻的数据元素在物理位置也相邻
- 通过指示元素地址的指针来表示元素之间的逻辑关系
- 优点:不会出现碎片现象,充分利用所有存储单元
- 缺点:每个元素的指针需要占用额外的存储空间;只能实现顺序存储
- 索引存储:在存储元素信息时建立附加的索引表
- 索引表中的每项称为索引项,索引项的一般形式:(关键字,地址)
- 优点:检索速度快
- 缺点:附加的索引表额外占用存储空间;更新数据时需要更新索引表,花费时间
- 散列存储(哈希存储):根据元素的关键字直接计算出该元素的存储地址
- 优点:检索,增加,删除结点速度快
- 缺点:结点的操作效率依赖于散列函数,若散列函数设计的不好,则可能出现存储单元冲突,并需要时间和空间开销去解决冲突
- 顺序存储:把逻辑上相邻的数据元素存储到物理上也相邻的存储单元中
数据结构使用计算机语言实现的逻辑结构,它依赖于计算机语言
顺序表,哈希表和单链表是三种不同的数据结构,既描述逻辑结构,又描述存储结构和数据运算
有序表是指关键字有序的线性表,仅描述元素之间的逻辑关系,与存储结构无关,因此是逻辑结构
循环队列是用顺序表表示的队列,是一种数据结构
栈是一种抽象数据类型,可采用顺序存储或链式存储,只表示逻辑结构