数据结构与算法(较全)

在这里插入图片描述

数据结构是以某种形式将数据组织在一起的集合,它不仅存储数据,还支持访问和处理数据的操作。

算法是为求解一个问题需要遵循的、被清楚指定的简单指令的集合

在这里插入图片描述

线性表

线性表是最常用且最简单的一种数据结构,它是n个数据元素的有限序列。

实现线性表的方式一般有两种,一种是使用数组存储线性表的元素,即用一组连续的存储单元依次存储线性表的数据元素。另一种是使用链表存储线性表的元素,即用一组任意的存储单元存储线性表的数据元素(存储单元可以是连续的,也可以是不连续的)。

数组实现

数组是一种大小固定的数据结构,对线性表的所有操作都可以通过数组来实现。虽然数组一旦创建之后,它的大小就无法改变了,但是当数组不能再存储线性表中的新元素时,我们可以创建一个新的大的数组来替换当前数组。这样就可以使用数组实现动态的数据结构。

代码1 创建一个更大的数组来替换当前数组
在这里插入图片描述

代码2 在数组位置index上添加元素e

在这里插入图片描述

上面简单写出了数组实现线性表的两个典型函数,具体我们可以参考Java里面的ArrayList集合类的源码。数组实现的线性表优点在于可以通过下标来访问或者修改元素,比较高效,主要缺点在于插入和删除的花费开销较大,比如当在第一个位置前插入一个元素,那么首先要把所有的元素往后移动一个位置。为了提高在任意位置添加或者删除元素的效率,可以采用链式结构来实现线性表。

链表

链表是一种物理存储单元上非连续、非顺序的存储结构,数据元素的逻辑顺序是通过链表中的指针链接次序实现的。链表由一系列节点组成,这些节点不必在内存中相连。每个节点由数据部分Data和链部分Next,Next指向下一个节点,这样当添加或者删除时,只需要改变相关节点的Next的指向,效率很高。

单链表的结构

下面主要用代码来展示链表的一些基本操作,需要注意的是,这里主要是以单链表为例,暂时不考虑双链表和循环链表。

代码3 链表的节点

在这里插入图片描述

代码4 定义好节点后,使用前一般是对头节点和尾节点进行初始化

在这里插入图片描述

代码5 空链表创建一个新节点
在这里插入图片描述

代码6 链表追加一个节点
在这里插入图片描述

代码7 顺序遍历链表

在这里插入图片描述

代码8 倒序遍历链表
在这里插入图片描述

代码 单链表反转
在这里插入图片描述
.

链表的实现还有其它的方式,常见的有循环单链表,双向链表,循环双向链表。 循环单链表 主要是链表的最后一个节点指向第一个节点,整体构成一个链环。 双向链表 主要是节点中包含两个指针部分,一个指向前驱元,一个指向后继元,JDK中LinkedList集合类的实现就是双向链表。 循环双向链表 是最后一个节点指向第一个节点。

栈与队列

栈和队列也是比较常见的数据结构,它们是比较特殊的线性表,因为对于栈来说,访问、插入和删除元素只能在栈顶进行,对于队列来说,元素只能从队列尾插入,从队列头访问和删除。

栈是限制插入和删除只能在一个位置上进行的表,该位置是表的末端,叫作栈顶,对栈的基本操作有push(进栈)和pop(出栈),前者相当于插入,后者相当于删除最后一个元素。栈有时又叫作LIFO(Last In
First Out)表,即后进先出。

队列

队列是一种特殊的线性表,特殊之处在于它只允许在表的前端(front)进行删除操作,而在表的后端(rear)进行插入操作,和栈一样,队列是一种操作受限制的线性表。进行插入操作的端称为队尾,进行删除操作的端称为队头。

我们可以使用链表来实现队列,下面代码简单展示了利用LinkedList来实现队列类。

代码9 简单实现队列类
在这里插入图片描述

普通的队列是一种先进先出的数据结构,而优先队列中,元素都被赋予优先级。当访问元素的时候,具有最高优先级的元素最先被删除。优先队列在生活中的应用还是比较多的,比如医院的急症室为病人赋予优先级,具有最高优先级的病人最先得到治疗

第一单元 串 \0

串(string)(或字符串)是由零个或多个字符组成的有序序列

串中任意个连续的字符组成的子序列称为该串的子串。包含子串的串相应的称为主串

空格(32)串并不等价于空串

串的下标也是从0开始的

6个串处理函数

(1)
Puts(“”)只能输出一个串,自带换行

(2)
Gets(a)可以输入空格,以回车结束

(3)
Strlen(a)实际长度,不计算\0在内的真实长度,返回值int

(4)
Strcmp(a,b)比较大小,比较的是ASCII值,返回值int

(5)
Strcpy(a,b)拷贝,也称作赋值,返回值类型是char *

(6)
Strcat(a,b)连接,后面的整体取代前一个字符串的\0,返回值类型char *

字符串截取,字符串的定位(模式匹配)三级知识点

KMP算法是一种匹配算法,优势是主串指针不会回溯,三个人发明

KMP 时间复杂度 O(n+m),其中呢n 和m分别是主串和字串的长度

第二单元 栈

定义:操作受限的线性表

栈的操作口只有栈顶(表尾),top

特性:先进后出,后进先出(last in first out)

进栈:先加后压,s.[++top]=e; s.top++;s.[top]=e; 压栈,进栈,入栈,push

出栈:先弹后减,e=s.[top- -]; e=s[top];top- - ; 弹栈,pop

判断

(1)栈空:s.top= =-1;

(2)栈满:s.top= =MAX-1;

  1. 存储方式:

(1)顺序栈:数据的变化在可控的范围内

(2)链栈:数据有时很小,有时非常大,那么最好是用链栈

第三单元 栈的应用

n的k次幂

  1. n的阶乘

斐波那契

  1. 字符串逆转

除了三个:消息的缓存,离散事件的模拟,作业的调度,其他所有都属于栈

括号匹配 :左进右出

表达式求值:优先级高的进,低的不让进,数据栈和符号栈

第四单元 队列

定义:操作受限的线性表

队头出(front),队尾进(rear)

特性:先进先出,后进后出(first in first out)

进队:q.[rear++]=e; q.[rear]=e;rear++; rear =(rear+1)%MAX

出队:e=q.[front++]; e=q[front];front++; front = (front+1)%MAX

判断:

(1)
队满:(rear+1)%MAX= =front

(2)
对空:front= =rear;

(3)
队长:(rear-front+MAX)%MAX;

  1. 存储方式:

(3)顺序队:它的变化在可控的范围内

(4)链队:不需要担心队列长度

循环队列解决普通队列的假溢出问题,用人为浪费单元格的方式区分队空队满

队列的应用:消息的缓存,离散事件的模拟,作业的调度

树与二叉树

树型结构是一类非常重要的非线性数据结构,其中以树和二叉树最为常用。在介绍二叉树之前,我们先简单了解一下树的相关内容。

树 是由n(n>=1)个有限节点组成一个具有层次关系的集合。它具有以下特点:每个节点有零个或多个子节点;没有父节点的节点称为 根 节点;每一个非根节点有且只有一个 父节点 ;除了根节点外,每个子节点可以分为多个不相交的子树。

树的结构

二叉树基本概念

·
定义

二叉树是每个节点最多有两棵子树的树结构。通常子树被称作“左子树”和“右子树”。二叉树常被用于实现二叉查找树和二叉堆。

·
相关性质

二叉树的每个结点至多只有2棵子树(不存在度大于2的结点),二叉树的子树有左右之分,次序不能颠倒。

二叉树的第i层至多有2(i-1)个结点;深度为k的二叉树至多有2k-1个结点。

一棵深度为k,且有2^k-1个节点的二叉树称之为 满二叉树 ;

深度为k,有n个节点的二叉树,当且仅当其每一个节点都与深度为k的满二叉树中,序号为1至n的节点对应时,称之为 完全二叉树 。

三种遍历方法

二叉树主要是由3个基本单元组成,根节点、左子树和右子树。如果限定先左后右,那么根据这三个部分遍历的顺序不同,可以分为先序遍历、中序遍历和后续遍历三种。

(1) 先序遍历 若二叉树为空,则空操作,否则先访问根节点,再先序遍历左子树,最后先序遍历右子树。
根左右

(2) 中序遍历 若二叉树为空,则空操作,否则先中序遍历左子树,再访问根节点,最后中序遍历右子树。 左根右

(3) 后序遍历 若二叉树为空,则空操作,否则先后序遍历左子树访问根节点,再后序遍历右子树,最后访问根节点。 左右根

·
树和二叉树的区别

(1) 二叉树每个节点最多有2个子节点,树则无限制。

(2) 二叉树中节点的子树分为左子树和右子树,即使某节点只有一棵子树,也要指明该子树是左子树还是右子树,即二叉树是有序的。

(3) 树决不能为空,它至少有一个节点,而一棵二叉树可以是空的。

二叉查找树

二叉查找树就是二叉排序树,也叫二叉搜索树。二叉查找树或者是一棵空树,或者是具有下列性质的二叉树: (1) 若左子树不空,则左子树上所有结点的值均小于它的根结点的值;(2) 若右子树不空,则右子树上所有结点的值均大于它的根结点的值;(3) 左、右子树也分别为二叉排序树;(4) 没有键值相等的结点。

不同形态平衡二叉树的ASL不同

含有n个节点的二叉查找树的平均查找长度和树的形态有关。最坏情况下,当先后插入的关键字有序时,构成的二叉查找树蜕变为单支树,树的深度为n,其平均查找长度(n+1)/2(和顺序查找相同),最好的情况是二叉查找树的形态和折半查找的判定树相同,其平均查找长度和log2(n)成正比。平均情况下,二叉查找树的平均查找长度和logn是等数量级的,所以为了获得更好的性能,通常在二叉查找树的构建过程需要进行“平衡化处理”,之后我们将介绍平衡二叉树和红黑树,这些均可以使查找树的高度为O(log(n))。

平衡二叉树

平衡二叉树又称AVL树,它或者是一棵空树,或者是具有下列性质的二叉树:它的左子树和右子树都是平衡二叉树,且左子树和右子树的深度之差的绝对值不超过1。

平衡二叉树

AVL树是最先发明的自平衡二叉查找树算法。在AVL中任何节点的两个儿子子树的高度最大差别为1,所以它也被称为高度平衡树,n个结点的AVL树最大深度约1.44log2n。查找、插入和删除在平均和最坏情况下都是O(log n)。增加和删除可能需要通过一次或多次树旋转来重新平衡这个树

红黑树

红黑树是平衡二叉树的一种,它保证在最坏情况下基本动态集合操作的时间复杂度为O(log
n)。

红黑树和平衡二叉树区别如下:

(1) 红黑树放弃了追求完全平衡,追求大致平衡,在与平衡二叉树的时间复杂度相差不大的情况下,保证每次插入最多只需要三次旋转就能达到平衡,实现起来也更为简单。

(2)
平衡二叉树追求绝对平衡,条件比较苛刻,实现起来比较麻烦,每次插入新节点之后需要旋转的次数不能预知。

图是一种较线性表和树更为复杂的数据结构,在线性表中,数据元素之间仅有线性关系,在树形结构中,数据元素之间有着明显的层次关系,而在图形结构中,节点之间的关系可以是任意的,图中任意两个数据元素之间都可能相关。图的应用相当广泛,特别是近年来的迅速发展,已经渗入到诸如语言学、逻辑学、物理、化学、电讯工程、计算机科学以及数学的其他分支中。

算法:

n的k次幂
在这里插入图片描述

n的阶乘
在这里插入图片描述

斐波那契
在这里插入图片描述

简单排序

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

优化冒泡
在这里插入图片描述
在这里插入图片描述

鸡兔同笼

蜗牛爬井

折纸超珠峰

希尔排序

折半查找

直接插入排序

哈希函数

哈希表

4种构造方法

1.直接定址法

2.数字分析法

3.平方取中法

4.除留余数法(用这个)

2种解决冲突方法

1.开放定址法

a.一次散列:+1+1+1

b.二次散列:+12-12+2^2

2.再哈希法

ASL:平均查找长度:总查找次数/元素个数

1.哈希函数构造方法

2.处理冲突方法

3.装填因子(上座率)

装填因子: 表中元素个数/表长

  • 7
    点赞
  • 59
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值