数据结构
第一章:数据结构的基本概念
定义
- 在任何问题中,数据元素都不是孤立存在的,而是在它们之间存在着某种关系,这种数据元素相互之间的关系称为结构(Structure)。数据结构是相互之间存在一种或多种特定关系的数据元素的集合。数据结构包括三方面的内容:逻辑结构、存储结构和数据的运算。数据的逻辑结构和存储结构是密不可分的两个方面,一个算法的设计取决于所选定的逻辑结构,而算法的实现依赖于所采用的存储结构。
逻辑结构
- 逻辑结构是指数据元素之间的逻辑关系,即从逻辑关系上描述数据。它与数据的存储无关,是独立于计算机的
- 数据的逻辑结构分为线性结构和非线性结构
- 集合 结构中的数据元素之间除了“同属于一个集合”的关系外,别无其他关系。 类似于数学上的集合
- 线性结构 结构中的数据元素之间只存在一对一的关系。比如排队
- 树形结构 结构中的数据元素之间存在一对多的关系。比如家族族谱
- 图状结构或网状结构 结构中的数据元素之间存在多对多的关系。 比如地图
物理结构
- 存储结构是指数据结构在计算机中的表示(又称映像),也称物理结构。它包括数据元素的表示和关系的表示。数据的存储结构是逻辑结构用计算机语言的实现,它依赖于计算机语言。数据的存储结构主要有:顺序存储、链式存储、索引存储和散列存储。
- 顺序存储:存储的物理位置相邻。(p.s. 物理位置即信息在计算机中的位置。)
- 链接存储:存储的物理位置未必相邻,通过记录相邻元素的物理位置来找到相邻元素。
- 索引存储:类似于目录,以后可以联系操作系统的文件系统章节来理解。
- 散列存储:通过关键字直接计算出元素的物理地址(以后详解)。
算法的五个特征
- 1,有穷性:有限步之后结束
- 2,确定性:不存在二义性,即没有歧义
- 3,可行性:比如受限于计算机的计算能力,有些算法虽然理论上可行,但实际上无法完成。
- 4,输入:能被计算机处理的各种类型数据,如数字,音频,图像等等。
- 5,输出:一至多个程序输出结果。
算法的复杂度
- 时间复杂度:
- • 它用来衡量算法随着问题规模增大,算法执行时间增长的快慢;
- • 是问题规模的函数:T(n)是时间规模函数 时间复杂度主要分析T(n)的数量级
- • T(n)=O(f(n)) f(n)是算法中基本运算的频度 一般我们考虑最坏情况下的时间复杂度
- 空间复杂度:
- • 它用来衡量算法随着问题规模增大,算法所需空间的快慢;
- • 是问题规模的函数:S(n)=O(g(n)) ;算法所需空间的增长率和g(n)的增长率相同。
概要: 复杂度计算为重点
- 常用的时间复杂度大小关系:
- 复杂度如何计算
- 时间复杂度计算(单个循环体)
- 直接关注循环体的执行次数,设为k
- 时间复杂度计算(多个循环体)
- 两个运算规则:乘法规则,加法规则。
- 时间复杂度计算(单个循环体)
第二章:线性表
线性表的逻辑结构
- 定义:线性表是具有相同数据类型的n(n≥0)个数据元素的有限序列。其中n为表长。当n=0时 线性表是一个空表
- 特点:线性表中第一个元素称为表头元素;最后一个元素称为表尾元素。
除第一个元素外,每个元素有且仅有一个直接前驱。
除最后一个元素外,每个元素有且仅有一个直接后继。
线性表的顺序存储结构
- 线性表的顺序存储又称为顺序表。
它是用一组地址连续的存储单元(比如C语言里面的数组),依次存储线性表中的数据元素,从而使得逻
辑上相邻的两个元素在物理位置上也相邻。 - 建立顺序表的三个属性:
1.存储空间的起始位置(数组名data)
2.顺序表最大存储容量(MaxSize)
3.顺序表当前的长度(length) - 其实数组还可以动态分配空间,存储数组的空间是在程序执行过程中通过动态存储分配语句分配
- 总结:
- 1.顺序表最主要的特点是随机访问(C语言中基于数组),即通过首地址和元素序号可以在O(1)的时间内找到指定的元素。
- 2.顺序表的存储密度高,每个结点只存储数据元素。无需给表中元素花费空间建立它们之间的逻辑关系(因为物理位置相邻特性决定)
- 3.顺序表逻辑上相邻的元素物理上也相邻,所以插入和删除操作需要移动大量元素。
顺序表的操作
- 1.插入
- 算法思路:
- 1.判断i的值是否正确
- 2.判断表长是否超过数组长度
- 3.从后向前到第i个位置,分别将这些元素都向后移动一位
- 4.将该元素插入位置i 并修改表长
- 代码
- 分析:
- 最好情况:在表尾插入(即i=n+1),元素后移语句将不执行,时间复杂度为O(1)。
- 最坏情况:在表头插入(即i=1),元素后移语句将执行
n次,时间复杂度为O(n)。 - 平均情况:假设pi(pi=1/(n+1) )是在第i个位置上插入
一个结点的概率,则在长度为n的线性表中插入一个结
点时所需移动结点的平均次数为
- 算法思路:
- 2.删除
- 算法思路:
- 1.判断i的值是否正确
- 2.取删除的元素
- 3.将被删元素后面的所有元素都依次向前移动一位
- 4.修改表长
- 代码
- 分析
- 最好情况:删除表尾元素(即i=n),无须移动元素,时间复杂度为O(1)。
- 最坏情况:删除表头元素(即i=1),需要移动除第一个元素外的所有元素,时间复杂度为O(n)。
- 平均情况:假设pi(pi=1/n)是删除第i个位置上结点的概率,则在长度为n的线性表中删除一个结点时所需移动结点的平均次数为
- 算法思路:
线性表的链式存储结构
- 线性表的链式存储是指通过一组任意的存储单元来存储线性表中的数据元素。
- 头结点和头指针的区别?
- 不管带不带头结点,头指针始终指向链表的第一个结点,而头结点是带头结点链表中的第一个结点,结点内通常不存储信息
- 为什么要设置头结点?
- 1.处理操作起来方便 例如:对在第一元素结点前插入结点和删除第一结点起操作与其它结点的操作就统一了
- 2.无论链表是否为空,其头指针是指向头结点的非空指针,因此空表和非空表的处理也就统一了。
单链表的操作
- 1.头插法建立单链表:
- 建立新的结点分配内存空间,将新结点插入到当前链表的表头
- 代码
- 2.尾插法建立单链表:
- 建立新的结点分配内存空间,将新结点插入到当前链表的表尾
- 代码
- 3.按序号查找结点
- 在单链表中从第一个结点出发,顺指针next域逐个往下搜索,直到找到第i个结点为止,否则返回最后一个结点指针域NULL。
- 代码
- 4.按值查找结点
- 从单链表第一个结点开始,由前往后依次比较表中各结点数据域的值,若某结点数据域的值等于给定值e,则返回该结点的指针;若整个单链表中没有这样的结点,则返回NULL。
- 代码
- 5.插入
- 插入操作是将值为x的新结点插入到单链表的第i个位置上。先检查插入位置的合法性,然后找到待插入位置的前驱结点,即第i−1个结点,再在其后插入新结点。
- 算法思路:
1.取指向插入位置的前驱结点的指针
① p=GetElem(L,i-1);
2.令新结点s的指针域指向p的后继结点
② s->next=p->next;
3.令结点p的指针域指向新插入的结点s
③ p->next=s;
- 6.删除
- 删除操作是将单链表的第i个结点删除。先检查删除位置的合法性,然后查找表中第i−1个结点,即被删结点的前驱结点,再将其删除。
- 算法思路:
1.取指向删除位置的前驱结点的指针 p=GetElem(L,i-1);
2.取指向删除位置的指针 q=p->next;
3.p指向结点的后继指向被删除结点的后继 p->next=q->next
4.释放删除结点 free(q);
双链表
- 定义
- 1.插入:(方法不唯一)
① s->next=p->next;
② p->next->prior=s;
③ s->prior=p;
④ p->next=s; - 2.删除:
① p->next=q->next;
② q->next->prior=p;
③ free(q);
循环链表&&静态链表
- 循环单链表:循环单链表和单链表的区别在于,表中最后一个结点的指针不是NULL,而改为指向头结点,从而整个链表形成一个环
- 循环双链表:类比循环单链表,循环双链表链表区别于双链表就是首尾结点构成环
- 当循环双链表为空表时,其头结点的prior域和next域都等于Head。
- 静态链表:静态链表是用数组来描述线性表的链式存储结构。
- 数组第一个元素不存储数据,它的指针域存储第一个元素所在的数组下标。链表最后一个元素的指针域值为-1。
- 例子
第三章:栈和队列
栈
- 栈(Stack):只允许在一端进行插入或删除操作的线性表。
- 栈顶(Top):线性表允许进行插入和删除的那一端。
- 栈底(Bottom):固定的,不允许进行插入和删除的另一端
- 特点:
1.栈是受限的线性表,所以自然具有线性关
系。
2.栈中元素后进去的必然先出来,即后进先出
LIFO(Last In First Out)- 栈中元素后进
去的必然先出
来,即后进先
出LIFO(Last In
First Out)
- 栈中元素后进
- 顺序栈
- 栈是线性表的特例,那栈的顺序存储也是线性表顺序存储的简化。栈的顺序存储结构也叫作顺序栈。
- 顺序栈的操作
- 1.判空:
- 2.进栈:
- 3.出栈:
- 4.读取栈顶元素:
- 共享栈
- 顺序栈的存储空间大小需要事先开辟好,很多时候对每个栈各自单独开辟存储空间的利用率不如将各个栈的存储空间共享
- 示意图
- 共享栈的结构
- 共享栈的操作:(进栈)
- 链式栈
- 栈是线性表的特例,线性表的存储结构还有链式存储结构,所以也可以用链表的方式来实现栈。栈的链式存储结构也叫作链栈。
- 特点
1.链栈一般不存在栈满的情况。
2.空栈的判定条件通常定为top==NULL; - 结构
- 链式栈的操作
- 1.进栈
- 2.出栈</