数据结构概述
定义
我们如何把现实中大量而复杂的问题以特定的数据类型和特定的存储结构
保存到主存储器(内存)中,以及在此基础上为实现某个功能(比如查找摸个
元素,删除某个元素,对所有元素进行排序)而执行的相应操作,这个相应
的操作也叫算法
数据结构 = 个体 + 个体的关系
算法 = 对存储数据的操作
算法
解题的方法和步骤
衡量算法的标准
1、时间复杂度
大概程序要执行的次数,而非执行时间
2、空间复杂度
算法执行过程中大概所占用的最大内存
3、难易程度
4、健壮性
数据结构的地位
数据结构是软件中最核心的课程
程序 = 数据的存储 + 数据的操作 +可以被计算机执行的语言
预备知识
指针
指针的重要性
指针是c语言的灵魂
定义
地址
地址就是内存单元的编号
从0开始的非负整数
范围:0-FFFFFFFF[0-4G-1]
指针
指针就是地址 地址就是指针
指针变量是存放内存单元地址的变量
指针的本质是一个操作受限的非负整数
分类
1、基本类型的指针
2、指针和数组的关系
结构体
为什么会出现结构体
为了表示一些复杂的数据,而普通的基本类型变量是无法满足要求
什么叫结构体
结构体是用户根据实际需要自定义的复合数据类型
如何使用结构体
struct Student st ={100,"zhangsan","22"};
struct Student * pst = &st;
1、st.sid
2、pst->sid
pst所指向的结构体变量中的sid这个成员
注意事项
结构体变量不能加减乘除,但可以相互赋值
普通结构体变量和结构体指针变量作为函数传参的问题
动态内存的分配和释放
模块一:线性结构[把所有的节点用一根直线穿起来]
连续存储[数组]
1、什么叫数组
元素类型相同,大小相等
2、数组的优缺点
存取速度快
插入删除元素慢
空间通常是有限的
需要大块连续的内存块
插入删除元素的效率极低
离散存储[链表]
定义:
n个节点离散分配
彼此通过指针相连
每个节点只有一个前驱节点,每个节点只有一个后续结点
首节点没有前驱节点,尾节点没有后续节点
专业术语:
首节点:第一个有效节点
尾节点:最后一个有效节点
头结点:
头结点的数据类型和首节点类型一样
第一个有效节点之前的那个节点
头节点并不存放有效数据
加头节点的目的主要是为了方便对链表的操作
头指针:指向头结点的指针变量
尾指针:指向尾节点的指针变量
确定一个链表需要几个参数:
只需要一个参数:头指针
因为我们通过头指针可以推断出链表的其他所有信息
分类:
单链表
双链表:每个节点有两个指针域
循环链表:能通过任何一个节点找到其他所有的结点
非循环链表
算法:
遍历
查找
清空
销毁
求长度
排序
删除节点
插入节点
狭义的算法是与数据的存储方式密切相关
广义的算法是与数据的存储方式无关的
泛型:利用某种技术达到的效果就是:不同的存储方式,执行的操作都是一样的
链表的优缺点:
插入和删除快
存取元素速度慢
存取容量无限
线性结构的两种应用之一 栈
定义:一种可以实现“先进后出”的存储结构,栈类似于箱子
分类:静态栈(数组)、动态栈(链式)
算法:出栈、压栈
应用:函数调用、中断、表达式求值、内存分陪、缓冲处理、迷宫
线性结构的两种应用之二 队列
定义:一种可以实现“先进先出”的存储结构
分类:链式队列(链表)、静态队列(数组,通常都是循环队列)
循环队列的讲解:
1、静态队列为什么必须是循环队列
2、循环队列需要几个参数来确定及其含义
需要两个参数 front rear
两个参数不同场合有不同含义
1)队列初始化 front和rear的值都是零
2)队列非空 front代表队列第一个元素 rear队列最后一个元素的下一个元素
3)队列空 front和rear的值相等但不一定是零
3、循环队列各个参数的含义
4、循环队列入队伪算法讲解
两步完成:
1、将值存入r所代表的位置
2、错误的写法r=r+1;
正确的写法r=(r+1)%数组的长度
5、循环队列出队伪算法讲解
front = (front+1)%数组的长度
6、如何判断循环队列是否为空
如果front与rear的值相等,则该队列就一定为空
7、如何判断循环队列是否已满
预备知识:front的值可能比rear大也可能小也可能相等
两种方式:1、多增加一个标识参数 2、少用一个元素(通常用这个)
如果r和f的值紧挨着,那队列已满
if((r+1)%数组长度 == f) 已满 else 不满
队列算法:入队、出队
队列的具体应用:所有和时间有关的操作都有队列的影子
专题:递归
定义:一个函数自己直接或间接调用自己
递归满足三个条件
1、递归必须得有一个明确的终止条件
2、该函数所处理的数据规模必须在递减
3、这个转化必须是可解的
循环和递归
递归:易于理解、速度慢、存储空间大
循环:不易理解、速度快、存储空间小
举例:
1、1+2+3+4+...+100
2、求阶乘
3、汉诺塔
4、走迷宫
模块二:非线性结构
树
树的定义:
专业定义:
1、有且只有一个称为根的节点
2、有若干互不相交的子树,这些子树本身也是一棵树
通俗的定义:
1、树是由节点和边组成
2、每个节点只有一个父节点但可以有多个子节点
3、但有一个节点例外,该节点没有父节点,此节点称为根节点
专业术语:
节点 父节点 子节点 子孙 堂兄弟
深度:从根节点到最底层节点的层数称之为深度,根节点是第一层
叶子节点:没有子节点的节点
非终端节点:实际就是非叶子节点
度:子节点的个数称为度
树的分类:
一般树
任意一个节点的子节点的个数不都不受限制
二叉树
任意一个节点的子节点的个数最多两个,且子节点的位置不可改变
分类:
一般二叉树
满二叉树: 在不增加树的层数的前提下,无法再多增加一个节点的二叉树就是满二叉树
完全二叉树:如果只是删除了满二叉树最底层最右边连续若干个节点,
这样形成的二叉树就是完全二叉树
森林
n个互补相交的树的集合
树的存储:
二叉树的存储
连续存储[完全二叉树]
优点:查找某个节点的父节点和子节点(也包括判断有没有节点)
缺点:耗用内存过大
链式存储
一般树的存储
双亲表示法:求父节点方便
孩子表示法:求子节点方便
双亲孩子表示法:求父节点和子节点都很方便
二叉树表示法:把一个普通树转换成二叉树存储
具体转换方法:
设法保证任意一个节点的做指针域指向第一个孩子
右指针域指向它的兄弟
森林的存储:森林转换成二叉树,在存储二叉树
操作:
遍历
先序遍历[先访问根节点]:先访问根节点再访问左子树再访问右子树
中序遍历[中间访问根节点]:中序遍历左子树再访问根节点再中序遍历右子树
后序遍历[最后访问根节点]:先中序遍历左子树再中序遍历右子树再访问根节点
已知两种遍历序列求原始二叉树
通过先序和中序 或者 中序和后序我们可以还原原始的二叉树
但是通过先序和后序是无法还原原始的二叉树的
换种说法只有通过先序和中序或中序和后序才可以唯一确定一个二叉树
应用:
树是数据库中数据组织的一种重要形式
操作系统父进程的关系本身就是一棵树
面向对象语言中类的继承关系本身就是一棵树
赫夫曼树
树的操作:
图
图的概念
图的定义
图的基本术语
1、端点和邻接点
2、顶点的度
3、完全图、稀疏图、稠密图
4、子图
5、路径和回路
6、连通和连通图
7、强连通图和强连通分量
8、权和网
9、
图的存储结构
1、邻接矩阵
2、邻接表
3、边集数组
图的遍历
1、图的深度优先搜索遍历
2、图的广度优先搜索遍历
图的应用
图的生成树和最小生成树
普里姆算法
克鲁斯卡尔算法
最短路径
模块三:查找和排序
折半查找
排序
冒泡
插入
选择
快速排序
归并排序
排序和查找的关系
排序是查找的前提
排序时重点