【数据结构】堆的顺序存储（笔记总结）

没有难学的知识~

已于 2023-09-23 09:45:19 修改

阅读量647

点赞数 13

分类专栏：数据结构文章标签：数据结构算法链表 c++

于 2023-04-09 18:02:15 首次发布

本文链接：https://blog.csdn.net/Weraphael/article/details/130028346

版权

数据结构专栏收录该内容

16 篇文章 2 订阅

订阅专栏

在这里插入图片描述

👦个人主页：@Weraphael
✍🏻作者简介：目前学习C++和算法
✈️专栏：数据结构
🐋 希望大家多多支持，咱一起进步！😁
如果文章对你有帮助的话
欢迎评论💬 点赞👍🏻 收藏 📂 加关注✨

一、树的概念及结构

1.1 什么是树

树是一种非线性的数据结构，它是由n(n ≥ 0)个有限结点组成的一个具有层次关系的集合，把它叫做树是因为它看起来像一颗倒挂的树，也就是说，二叉树是根朝上，而叶是朝下的。

如上图所示，树可以分成根和子树。举个例子，A是根，则BEFJ、CGKL、DHI就是子树；接下来B也能称为根，则EFJ就是他的子树，后面以此类推，因此树是递归定义的

注意：树形结构中，子树之间不能有交集，否则就不是树形结构

在这里插入图片描述

以上三种皆不是树形结构。那什么样的才算是树呢？

子树是不相交的。
除了根结点外，每个结点有且仅有一个父结点。
一颗N个结点的树有N-1条边。

1.2 树的相关概念（常见）

在这里插入图片描述

结点的度：一个结点含有的子树的个数称为该结点的度（根的孩子的个数）。如上图，A作为根，其结点的度为6.
叶子结点：度为0的结点（无孩子的）。如上图，B、C、H、I、P、Q、K、L、M、N都是叶结点
父结点：若一个结点含有子结点，则这个结点称为其子结点的父结点；如上图：A是B的父结点
孩子结点：一个结点含有的子树的根结点称为该结点的子结点；如上图：B是A的孩子结点
树的高度（深度）：树中结点的最大层次；如上图：树的高度为4
结点的祖先：从根到该结点所经分支上的所有结点；如上图：A是所有结点的祖先
子孙：以某结点为根的子树中任一结点都称为该结点的子孙。如上图：所有结点都是A的子孙

1.3 树的结构

左孩子右兄弟表示法

在这里插入图片描述

typedef int DataType;
struct Node
{
	struct Node* LeftChild1;  // 左孩子结点
	struct Node* Brother; // 兄弟结点
	DataType data; // 结点中的数据
};

二、二叉树的概念及结构

2.1 概念

一颗二叉树是结点的一个有限集合，该集合：

可能为空。
或者由一个根结点加上两颗别称为左子树和右子树组成。

在这里插入图片描述

从上图可以看出：

二叉树不存在度大于2的结点，也就是说，二叉树的根的孩子不能超过2个（计划生育的树hh）
二叉树的子树有左右之分，次序不能颠倒，因此二叉树是有序树

注意：对于任意的二叉树都是由以下5种情况复合而成的：

2.2 特殊的二叉树

满二叉树：如果每一个层的结点数都达到最大值，则这个二叉树就是满二叉树。

在这里插入图片描述

那么接下来问题来了，如果说一个二叉树的高度为h，如何推算出满二叉树的结点总数呢？

在这里插入图片描述

从上图中，对每一层的个数分析，发现这就是一个等比数列，因此，可以利用等比数列求和公式来算出结点总数，满二叉树结点总数为：2^h - 1

完全二叉树：完全二叉树是效率很高的数据结构。它是由满二叉树而引出来的。

在这里插入图片描述

完全二叉树结构特点：

假设有h层，前h - 1层是满的
最后一层要求从左到右是要连续的

问：下面是否是完全二叉树？

答案：不是，因为它的最后一层不连续。

最后一个问题，如果说一个二叉树的高度为K，求完全二叉树结点总数的范围？
答案：[2^k-1，2^k - 1]

解析：
首先，满二叉树是一种特殊的完全二叉树，所以结点个数最多的情况就是满二叉树，因此个数为2^k - 1
最后，最小的极限情况就是当完全二叉树最后一层只有一个结点的时候。因此，可以先计算前k - 1层的结点总数，根据等比数列求出个数为：2^k-1 - 1，然后再加上最后一层的最后一个节点，因此，结果就为：2^k-1
【例题】
一颗完全二叉树的结点个数为531个，那么这棵树的高度为多少？B
A 11
B 10
C 8
D 12
做法：将ABCD代入[2^k-1，2^k - 1]，若531在其范围内，则就是答案。

2.3 二叉树的性质

对任何一颗二叉树，如果度为0（叶结点）的结点个数为n0，度为2的结点个数为n2，则有n0 = n2 + 1（度为0的永远比度为2的多一个）
【证明】

【例题1】
某二叉树共有399个结点，其中有199个度为2的结点，则该二叉树中的叶节点个数为多少？
答案： 200
解析：
首先叶结点就是度为0的结点，然后根据性质：n0 = n2 + 1，即可得出叶结点的个数为200

【例题2】
在具有2n个结点的完全二叉树中，叶结点的个数为多少？

2.4 二叉树的存储结构

二叉树一般可以使用两种结构存储，一种顺序结构，一种链式结构。

顺序存储

顺序结构存储就是使用数组来存储，一般使用数组只适合表示完全二叉树，因为不是完全二叉树会有空间的浪费。而现实中使用中只有堆才会使用数组来存储。二叉树顺序存储在物理上是一个数组，在逻辑上是一颗二叉树。

在这里插入图片描述

从物理的角度看（实实在在在内存中的存储）：二叉树顺序存储是一个数组；从逻辑的角度看（想象出来的）：它是一个二叉树（如上图）**

typedef int hptypedata;
struct BinaryTreeNode
{
	hptypedata* a; 
	int size; 
	int capacity;
};

需要注意的是，这里的堆和操作系统虚拟进程地址空间中的堆是两回事，一个是数据结构，一个是操作系统中管理内存的一块区域分段。

在这里插入图片描述

链式存储

点击跳转

三、堆

3.1 堆的性质

一颗普通的二叉树如果使用顺序结构的数据来存储，但是存储并没有什么意义。因此引入了堆的性质。

堆的性质

堆中某个节点的值总是不大于或不小于其父节点的值
堆总是一棵完全二叉树

堆的结构

小根堆又称小堆，其特点是：父亲结点总小于或等于孩子结点
大根堆又称大堆：其特点是：父亲结点总大于或等于孩子结点

3.2 堆的作用及父子关系

在实现堆之前，先说明堆的作用及父子关系

堆的作用

常用来频繁变动的数据集中找出最值。 比如，小堆的根结点是整个二叉树中最小的，大堆的根结点是整个二叉树最大的。还能找到次大（次小）的，只要删除堆顶元素，再重新建堆，即可实现。

父子关系

通过下标关系，不难可以写出以下关系

如何找到父亲结点：parent = （child - 1）/ 2
如何找到左孩子结点：leftchild = parent * 2 + 1
如何找到右孩子结点：rightchild = parent * 2 + 2（右孩子比左孩子的下标多1）

四、堆的实现

4.1 准备工作

为了方便管理，我们可以创建多个文件来实现
test.c - 测试代码逻辑（源文件）
heap.c - 动态的实现（源文件）
heap.h - 存放函数的声明（头文件）

4.2 常见接口

【heap.h】

typedef int hptypedata;

typedef struct heap
{
	hptypedata* a;
	int size;
	int capacity;
}hp;

//结构体初始化
void HeapInit(hp* hph);

//尾插
void HeapPush(hp* hph, hptypedata x);

//头删
void HeapPop(hp* hph);

//堆顶元素
hptypedata HeapTop(hp* hph);

//判断堆是否为空
bool HeapEmpty(hp* hph);

//堆的个数大小
int HeapSize(hp* hph);

//堆的销毁
void HeapDestroy(hp* hph);

void HeapPush(hp* hph, hptypedata x);

//向上调整
void AdjustUp(hptypedata* a, int child);

//向下调整
void AdjustDown(hptypedata* a, int parent);

4.3 堆的初始化

【heap.c】

void HeapInit(hp* hph)
{
	assert(hph);

	hph->a = (hptypedata*)malloc(sizeof(hptypedata) * 4);
	if (hph->a == NULL)
	{
		perror("hph->a :: malloc");
		return;
	}
	hph->capacity = 4;
	hph->size = 0;
}

其实就是顺序表的初始化，详情 —>[传送门]

4.4 堆的尾插 (向上调整建堆)

以下代码以大堆为例

void Swap(hptypedata* p1, hptypedata* p2)
{
	hptypedata tmp = *p1;
	*p1 = *p2;
	*p2 = tmp;
}

void AdjustUp(hptypedata* a, int child)
{
	//找到父亲节点
	int parent = (child - 1) / 2;

	while (child > 0) //while (parent >= 0)
	{
		if (a[child] > a[parent])
		{
			Swap(&a[child], &a[parent]);
			//交换完迭代继续
			child = parent;
			parent = (child - 1) / 2;
		}
		//如果尾插的节点不比其父亲大，就没必要比了
		else
		{
			break;
		}
	}
}

void HeapPush(hp* hph, hptypedata x)
{
	assert(hph);

	// 可能会扩容
	if (hph->size == hph->capacity)
	{
		hptypedata* tmp = (hptypedata*)realloc(hph->a, sizeof(hptypedata) * hph->capacity * 2);
		if (tmp == NULL)
		{
			perror("tmp :: realloc");
			return;
		}
		hph->a = tmp;
		hph->capacity *= 2;
	}
	//插入
	hph->a[hph->size] = x;
	hph->size++;
	
	//向上调整
	AdjustUp(hph->a, hph->size - 1);
	//hph->size - 1 指的是尾插元素（孩子）的下标
}

【笔记总结】

首先尾插后，由于还要保持大堆的性质，如果尾插的结点要比其父结点大，就要进行向上调整
【动图展示】

为什么多了一个交换函数Swap?
因为后面一些接口也会交换两个数，为了让代码复用，因此写了一个Swap函数
在向上调整中，不用while (parent >= 0)的原因
首先这个循环条件也是可以正常运行的。但是，当parent迭代指向根节点(下标0)，此时执行了if语句，child就迭代到根节点，其parent = (0 - 1) / 2 = 0，循环结束后parent等于0还是会进入循环，而此时parent和child同时在根节点，虽然不会死循环，但是有点多次一举，就像庄周带净化
向上调整有一个前提：除了child这个位置，前面的数据必须保持堆的性质

4.5 堆的头删

void AdjustDown(hptypedata* a, int n,int parent)
{
	//假设左孩子一开始最大
	int child = parent * 2 + 1;
	//当child走到叶子节点循环结束，也就是说它不能超过数组的大小
	while (child < n)
	{
		//判断右孩子是否真的比左孩子大
		//注意还要防止数组越界
		if (child + 1 < n && a[child + 1] > a[child])
		{
			child++;
		}

		if (a[child] > a[parent])
		{
			Swap(&a[child], &a[parent]);
			//迭代
			parent = child;
			child = parent * 2 + 1;
		}
		else
		{
			break;
		}
	}
}

void HeapPop(hp* php)
{
	assert(php);
	//空的顺序表不能删
	assert(!HeapEmpty(php));

	//不能挪动数据删，一方面效率低下，另一方面父子关系会乱
	//正确方法：交换头尾，再进行尾删
	
	//交换
	Swap(&php->a[0], &php->a[php->size - 1]);
	//尾删
	php->size--;

	//保证是大堆性质，进行向下调整
	AdjustDown(php->a, php->size,0);
}

【笔记总结】

为什么堆有头删却没有尾删？
首先堆的尾删是没有意义的，即使删了尾，它还是个堆。
而头删是有意义的，当它和heaptop接口配合起来。当它是大堆时，就能选出第一大、第二大…小堆也是如此
头删为什么不能直接删头？
第一点：顺序表头删效率低
第二点：即使头删会导致关系混乱
正确做法：先头尾交换，再删掉尾（间接把头删了），最后再进行向下调整
在向下调整的过程中，由于要满足大堆的性质，当前的根结点要与自己的两个孩子比较大小，大的那个作为新的根。那么如何优雅的比较呢？首先可以利用假设逻辑，假设一开始左孩子最大，然后再判断是否左孩子真的大于右孩子，如果右孩子真的大于左孩子，则让child++，因为左孩子和右孩子的下标关系相差1
向下调整的前提是：左右子树都要保持大堆或者小堆的性质

【动图展示】

4.6 堆顶元素

hptypedata HeapTop(hp* php)
{
	assert(php);
	return php->a[0];
}

4.7 判断堆顶是否为空


bool HeapEmpty(hp* hph)
{
	assert(hph);

	return hph->size == 0;
}

4.8 堆的大小

int HeapSize(hp* hph)
{
	assert(hph);

	return hph->size;
}

4.9 堆的销毁

void HeapDestroy(hp* hph)
{
	assert(hph);

	free(hph->a);
	hph->a = NULL;
	hph->size = 0;
	hph->capacity = 0;
}

没有难学的知识~

关注

13
点赞
踩
11

收藏

觉得还不错? 一键收藏
11
评论
【数据结构】堆的顺序存储（笔记总结）

数据结构之堆笔记总结
复制链接

扫一扫

专栏目录

【数据结构】堆的顺序存储（笔记总结）

目录

一、树的概念及结构

1.1 什么是树

1.2 树的相关概念（常见）

1.3 树的结构

二、二叉树的概念及结构

2.1 概念

2.2 特殊的二叉树

2.3 二叉树的性质

2.4 二叉树的存储结构

三、堆

3.1 堆的性质

3.2 堆的作用及父子关系

四、堆的实现

4.1 准备工作

4.2 常见接口

4.3 堆的初始化

4.4 堆的尾插 (向上调整建堆)

4.5 堆的头删

4.6 堆顶元素

4.7 判断堆顶是否为空

4.8 堆的大小

4.9 堆的销毁

“相关推荐”对你有帮助么？