数据结构：二叉树(堆)的顺序存储-CSDN博客

本文链接：https://blog.csdn.net/2301_79601095/article/details/140748889

1. 树

1.1 树的概念和结构

树是一种非线性的数据结构，它是由 n（n>=0）个有限结点组成⼀个具有层次关系的集合。把它叫做树是因为它看起来像一棵倒挂的树，也就是说它是根朝上，而叶朝下的。

有一个特殊的结点，称为根结点，根结点没有前驱结点。
除根结点外，其余结点被分成 M(M>0) 个互不相交的集合 T1、T2、……、Tm ，其中每一个集合Ti(1 <= i <= m) 又是一棵结构与树类似的子树。每棵子树的根结点有且只有一个前驱，可以有 0 个或多个后继。因此，树是递归定义的。

在这里插入图片描述
树形结构中，子树之间不能有交集，否则就不是树形结构

以下三棵树是非树形结构：

请添加图片描述

子树是不相交的
除了根结点外，每个结点有且仅有一个父结点
一棵N个结点的树有N-1条边

1.2 树的相关术语

在这里插入图片描述

父结点/双亲结点：若一个结点含有子结点，则这个结点称为其子结点的父结点；如上图：A是B的父结点
子结点/孩子结点：一个结点含有的子树的根结点称为该结点的子结点；如上图：B是A的孩子结点
结点的度：一个结点有几个孩子，他的度就是多少；比如A的度为6，F的度为2，K的度为0
树的度：一棵树中，最大的结点的度称为树的度；如上图：树的度为 6
叶子结点/终端结点：度为 0 的结点称为叶结点；如上图： B、C、H、I… 等结点为叶结点
分支结点/非终端结点：度不为 0 的结点；如上图： D、E、F、G… 等结点为分支结点
兄弟结点：具有相同父结点的结点互称为兄弟结点(亲兄弟)；如上图： B、C 是兄弟结点
结点的层次：从根开始定义起，根为第 1 层，根的子结点为第 2 层，以此类推；
树的高度或深度：树中结点的最大层次；如上图：树的高度为 4
结点的祖先：从根到该结点所经分支上的所有结点；如上图： A 是所有结点的祖先
路径：一条从树中任意节点出发，沿父节点-子节点连接，达到任意节点的序列；比如A到Q的路径为：A-E-J-Q；H到Q的路径H-D-A-E-J-Q
子孙：以某结点为根的子树中任一结点都称为该结点的子孙。如上图：所有结点都是A的子孙
森林：由 m（m>0）棵互不相交的树的集合称为森林；

2. 二叉树

2.1 二叉树的概念和结构

二叉树（Binary Tree）是一种树形数据结构，其中每个节点最多有两个子节点，通常被称为左子节点和右子节点。二叉树可以是空树，或者由一个根节点和两个互不相交的、分别被称为左子树和右子树的二叉树组成。

在这里插入图片描述

2.2 二叉树的特点

二叉树不存在度大于 2 的结点
二叉树的子树有左右之分，次序不能颠倒，因此二叉树是有序树

对于任意的二叉树都是由以下几种情况复合而成的
在这里插入图片描述

2.3 特殊的二叉树

2.3.1 满二叉树

一个二叉树，如果每一层的结点数都达到最大值，则这个二叉树就是满二叉树。也就是说，如果一个个二叉树的层数为 k ，且结点总数是 2k − 1 ，则它就是满二叉树。
在这里插入图片描述

2.3.2 完全二叉树

完全二叉树是效率很高的数据结构，完全二叉树是由满二叉树而引出来的。对于深度为 k 的，有 n 个结点的二叉树，当且仅当其每一个结点都与深度为k的满二叉树中编号从 1 至 n 的结点一一对应时称之为完全二叉树。要注意的是满二叉树是⼀种特殊的完全二叉树。

在这里插入图片描述

完全二叉树的性质：

节点排列紧密：除了最底层外，完全二叉树的每一层都被完全填满，且所有节点都尽可能地向左对齐。这意味着树的节点排列非常紧凑，没有空闲的空间。
叶子节点特性：完全二叉树的叶子节点只可能出现在最底层和次底层。在最底层，叶子节点从左到右依次排列；如果存在次底层，则次底层的叶子节点在根节点右子树的部分。
完全二叉树与满二叉树：满二叉树是完全二叉树的一个特例，其中每一层都被完全填满，没有任何空缺。完全二叉树则允许最后一层有空缺，但空缺必须全部集中在最右边。

2.4 二叉树的性质

二叉树第i层的结点个数：若规定根结点的层数为 1 ，则一棵非空二叉树的第i层上最多有 2^(i-1) 个结点
二叉树的总结点个数：若规定根结点的层数为 1 ，则深度为 h 的二叉树的最大结点数是 2^h-1
满二叉树的深度：若规定根结点的层数为 1 ，则具有 n 个结点的满二叉树的深度为h = log2 (n + 1) ( log以2为底， n+1 为对数)

3. 实现顺序结构二叉树

一般堆使用顺序结构的数组来存储数据，堆是⼀种特殊的二叉树，具有⼆叉树的特性的同时，还具备其他的特性。

3.1 堆的概念和结构

堆（Heap）是一种特殊的完全二叉树结构，其中每个节点的值都遵循特定的堆属性（heap property）。根据堆属性的不同，堆可以分为两种主要类型：最大堆（Max Heap）和最小堆（Min Heap）。

最大堆：在最大堆中，每个节点的值都大于或等于其子节点的值。这意味着根节点（堆顶）是堆中的最大值。
最小堆：在最小堆中，每个节点的值都小于或等于其子节点的值。因此，根节点（堆顶）是堆中的最小值。

在这里插入图片描述
堆具有以下性质：

堆中某个结点的值总是不大于或不小于其父结点的值；
堆总是一棵完全二叉树。

对于具有 n 个结点的完全二叉树，如果按照从上至下从左至右的数组顺序对所有结点从 0 开始编号，则对于序号为 i 的结点有：

若 i>0 ， i 位置结点的双亲序号： (i-1)/2 ； i=0 ， i 为根结点编号，无双亲结点
若 2i+1<n ，则左孩子序号： 2i+1 ；若2i+1>=n 无左孩子
若 2i+2<n ，则右孩子序号： 2i+2 ；若2i+2>=n 无右孩子

下面来定义堆的顺序结构和具体要实现的功能：

typedef int HPDataType;
typedef struct Heap {
	HPDataType* arr;
	int capacity;//堆的空间大小
	int size;//堆的有效数据个数
}HP;
//初始化
void HPInit(HP* php);
//销毁
void HPDestroy(HP* php);
//入堆(堆尾)
void HPPush(HP* php, HPDataType x);
//出堆(堆顶)
void HPPop(HP* php);
//返回堆顶
HPDataType HPTop(HP* php);
//判空
bool HPEmpty(HP* php);
//向上调整算法
void AdjustUp(HPDataType* arr, int child);
//向下调整算法
void AdjustDown(HPDataType* arr, int parent, int n);
//交换
void Swap(int* a, int* b);

3.2 初始化

思路：将堆这个结构体的地址取过来用一级指针接收，实现形参改变实参，然后将指针置为空，空间大小和有效数据个数置为0即可

//初始化
void HPInit(HP* php)
{
	assert(php);//php!=NULL
	php->arr = NULL;
	php->capacity = php->size = 0;
}

3.3 销毁

思路：如果动态数组不为空需要使用free函数对其空间进行释放，然后将堆的空间大小和有效数据个数置为0，如果动态数组为空，直接将堆的空间大小和有效数据个数置为0即可

//销毁
void HPDestroy(HP* php)
{
	assert(php);//php!=NULL
	if (php->arr)
	{
		//销毁内存
		free(php->arr);
	}
	php->capacity = php->size = 0;
}

3.4 插入数据

思路：首先判断空间大小是否为满，如果空间大小满了(php->size == php->capacity)则需要使用realloc函数对原来的数组进行扩容，扩容成功后将数据插入堆尾，然后进行向上调整将数据的顺序重新调整，最后将堆的有效数据加一即可

//入堆
void HPPush(HP* php, HPDataType x)
{
    assert(php);//php!=NULL
	if (php->size == php->capacity)
	{
		//空间不够需要扩容
		int newCapacity = php->capacity == 0 ? 4 : 2 * php->capacity;
		//先判断空间容量capacity是否为0，为0就默认扩容四个大小空间，不为0就扩容为原来的两倍
		HPDataType* tmp = (HPDataType*)realloc(php->arr, newCapacity * sizeof(HPDataType));
		//因为是在原来空间上申请更大的空间，所以要使用realloc函数对数组进行扩容
		if (tmp == NULL)
		{
			//申请失败，打印错误信息
			perror("realloc fail!");
			exit(1);
		}
		//申请成功
		php->arr = tmp;
		php->capacity = newCapacity;
	}
	php->arr[php->size] = x;
	//每次往堆里面插入数据都要向上调整
	AdjustUp(php->arr, php->size);
	php->size++;//最后堆的有效数据+1
}

3.5 向上调整算法

先将元素插入到堆的末尾,即最后一个孩子之后，插入之后如果堆的性质遭到破坏，将新插入的结点顺着其父节点往上调整到合适位置即可

在这里插入图片描述
思路：因为向上调整算法是不断调整父节点和孩子结点的顺序，如果是建小堆就判断父节点是否大于孩子结点，如果大于就交换父结点和孩子结点，然后更新父结点和孩子结点继续向上调整，使得堆里面所有的父结点都小于等于孩子结点。如果建的是大堆，则反之。

根据孩子结点得出父结点：parent = (child - 1) / 2

注意：当向上调整到根节点时就不用继续向上调整了，因为根节点没有父节点，所以循环条件为child>0

建小堆：

void Swap(int* a, int* b)
{
	int temp = *a;
	*a = *b;
	*b = temp;
}
void AdjustUp(HPDataType* arr, int child)
{
    //建小堆
	int parent = (child - 1) / 2;
	while (child > 0)
	{
		if (arr[child] < arr[parent])
		{
			//如果父节点大于孩子结点就交换
			Swap(&arr[child], &arr[parent]);
			//更新孩子结点和父节点
			child = parent;
			parent = (child - 1) / 2;
		}
		else
		{
			break;
		}
	}
}

建大堆：

void Swap(int* a, int* b)
{
	int temp = *a;
	*a = *b;
	*b = temp;
}
void AdjustUp(HPDataType* arr, int child)
{
	//建大堆
	int parent = (child - 1) / 2;
	while (child > 0)
	{
		if (arr[child] > arr[parent])
		{
		    //如果孩子结点大于父结点就交换
			Swap(&arr[child], &arr[parent]);
			//更新父结点和孩子结点
			child = parent;
			parent = (child - 1) / 2;
		}
		else
		{
			break;
		}
	}
}

向上调整算法的时间复杂度为：O(log n)
向上调整算法建堆的时间复杂度：O(n ∗ log2 n)

3.6 删除数据(堆顶)

思路：既然要删除堆顶数据，所以堆的有效数据个数不能为空。先将堆顶和堆尾的数据进行交换，再将堆尾数据删除(堆的有效数据个数减一)，最后从根节点进行向下调整

//出堆
void HPPop(HP* php)
{
	assert(php&&php->size);//php!=NULL，php->size!=0
	//交换堆顶和堆尾的数据
	Swap(&php->arr[0], &php->arr[php->size - 1]);
	//有效数据-1
	--php->size;
	//从根节点开始向下调整
	AdjustDown(php->arr, 0, php->size);
}

3.7 向下调整算法

删除堆是删除堆顶的数据，将堆顶的数据跟最后一个数据交换，然后删除数组最后一个数据，再进行向下调整算法。

在这里插入图片描述

向下调整算法有一个前提：左右子树必须是一个堆，才能调整。

已知一个父节点parent算出左右孩子节点：
左孩子：child = 2 * parent + 1
右孩子：child = 2 * parent + 2

向下调整算法：如果建的是小堆，首先从根节点作为父结点开始与其左右孩子进行比较，如果父节点大于左孩子节点或者大于右孩子节点(如果都大于则与最小的孩子节点进行交换)，然后更新父节点和孩子节点，继续向下调整，如果父节点小于左右孩子节点则停止，使得所有的父节点都小于或等于孩子节点。如果建的是大堆，则反之。

注意：当向下调整到最后一层的时候就停止，因为最后一层如果作为父节点是没有孩子节点的，所以不用继续向下调整了，所以循环条件为child<n

建小堆：

void Swap(int* a, int* b)
{
	int temp = *a;
	*a = *b;
	*b = temp;
}
void AdjustDown(HPDataType* arr, int parent,int n)
{
    //建小堆
	int child = 2 * parent + 1;
	while (child < n)
	{
		if (child + 1 < n && arr[child] > arr[child + 1])
		{
			//如果右孩子节点比左孩子节点小，那么child++，使child变成右孩子节点的下标
			child++;
		}
		if (arr[child] < arr[parent])
		{
			//如果孩子节点比父节点小就交换
			Swap(&arr[child], &arr[parent]);
			//更新父节点和孩子节点，继续向下调整
			parent = child;
			child = 2 * parent + 1;
		}
		else
		{
			break;
		}
	}
}

建大堆：

void Swap(int* a, int* b)
{
	int temp = *a;
	*a = *b;
	*b = temp;
}
void AdjustDown(HPDataType* arr, int parent, int n)
{
	//建大堆
	int child = 2 * parent + 1;
	while (child < n)
	{
		if (child + 1 < n && arr[child] < arr[child + 1])
		{
		    //如果右孩子节点比左孩子节点大，那么child++，使child变成右孩子节点的下标
			child++;
		}
		if (arr[child] > arr[parent])
		{
		    //如果孩子节点比父节点大就交换
			Swap(&arr[child], &arr[parent]);
			//更新父节点和孩子节点，继续向下调整
			parent = child;
			child = 2 * parent + 1;
		}
		else
		{
			break;
		}
	}
}

向下调整算法的时间复杂度为：O(log n)
向下调整算法建堆的时间复杂度：O(n)

3.8 返回堆顶数据

思路：因为要返回堆顶数据，所以堆不能为空。直接返回堆顶数据即可。

//返回堆顶
HPDataType HPTop(HP* php)
{
	assert(php);//php!=NULL
	assert(php->size);//堆的有效数据个数不为0
	return php->arr[0];//返回堆顶数据
}

3.9 判空

思路：如果堆的有效数据个数为0堆就为空

//判空
bool HPEmpty(HP* php)
{
	assert(php);//php!=NULL
	return php->size == 0;//如果堆的有效数据个数为0则为空
}

3.10 返回堆的有效数据个数

思路：直接返回堆的有效数据个数size

//返回堆的有效数据个数
int HPSize(HP* php)
{
	assert(php);//php!=NULL
	return php->size;
}

4. 堆的应用

4.1 堆排序

方法一：创建一个堆，如果要升序就建小堆，如果要排降序就建大堆，每次将堆顶数据给回数组a，再将堆顶数据删除并且向下调整，再返回堆顶数据…… 一直到堆为空为止

void HeapSort(int* a, int n)
{
    HP hp;
    for(int i = 0; i < n; i++)
    {
        HPPush(&hp,a[i]);
    }
    int i = 0;
    while (!HPEmpty(&hp))
    {
        a[i++] = HPTop(&hp);
        HPPop(&hp);
    }
    HPDestroy(&hp);
}

该方法的时间复杂度为O(N)，空间复杂度也为O(N)

方法二：用原来的数组建堆(从数组的最后一个数据的父节点开始向下调整，向下调整完再将下标减一，继续向下调整，直到根节点向下调整完为止)，首尾交换，交换后的堆尾数据从堆中删掉，将堆顶数据向下调整，然后不断地首尾交换和交换后的堆尾数据从堆中删掉，一直到堆尾数据等于堆顶数据即可。如果要排降序就建小堆，如果要升序就建大堆

void HeapSort(int* arr, int n)
{
	//向上调整算法建堆 O(n∗log2 n)
	//for (int i = 0; i < n; i++)
	//{
		//AdjustUp(arr, i);
	//}
	//向下调整算法建堆 O(n)
	for (int i = (n - 1 - 1) / 2; i >= 0; i--)
	{
		AdjustDown(arr, i, n);
	}
	int end = n - 1;
	while (end > 0)
	{
		Swap(&arr[0], &arr[end]);
		AdjustDown(arr, 0, end);
		end--;
	}
}

堆排序时间复杂度为： O(nlog n) ，空间复杂度为：O(1)

4.2 TOP-K问题

TOP-K问题：即求数据集合中前k个最大的元素或者最小的元素，一般情况下数据量都比较大。

思路：先取数据集合的前k个元素来建堆，如果求前k个最大的元素就建小堆，如果是求前k个最小的元素就建大堆。然后用n-k个数据来跟堆顶比较，如果不满足条件，就替换堆顶元素并且向下调整，将剩余的元素全部跟堆顶比较完后，堆中的k个元素就是所求的前k个最大的元素或者最小的元素

void CreateNData()
{
	int n = 100000;
	srand(time(0));
	const char* file = "data.txt";
	FILE* fin = fopen(file, "w");
	if (fin == NULL)
	{
		perror("fopen error");
		return;
	}
	for (int i = 0; i < n; i++)
	{
		int x = (rand() + i) % 1000000;
		fprintf(fin, "%d\n", x);
	}
	fclose(fin);
}
void TOPk()
{
	int k = 0;
	printf("请输入k: ");
	scanf("%d", &k);
	//从文件中读取前k个数据，建堆
	const char* file = "data.txt";
	FILE* fout = fopen(file, "r");
	if (fout == NULL)
	{
		perror("fopen fail!");
		exit(1);
	}
	int* minHeap = (int*)malloc(k * sizeof(int));
	if (minHeap == NULL)
	{
		perror("malloc fail!");
		exit(2);
	}
	//从文件中读取前k个数据
	for (int i = 0; i < k; i++)
	{
		fscanf(fout, "%d", &minHeap[i]);
	}
	//建小堆
	for (int i = (k - 1 - 1) / 2; i >= 0; i--)
	{
		AdjustDown(minHeap, i, k);
	}
	int x = 0;
	while (fscanf(fout, "%d", &x) != EOF)
	{
		if (x > minHeap[0])
		{
			minHeap[0] = x;
			AdjustDown(minHeap, 0, k);
		}
	}
	for (int i = 0; i < k; i++)
	{
		printf("%d ", minHeap[i]);
	}
	fclose(fout);
}