二叉树之堆的应用

酒竹.

已于 2023-12-29 15:28:31 修改

阅读量1.8k

点赞数 24

分类专栏： c语言学习篇数据结构篇文章标签：数据结构 c语言算法

于 2023-12-29 15:13:04 首次发布

本文链接：https://blog.csdn.net/weixin_60358305/article/details/135289163

版权

数据结构篇同时被 2 个专栏收录

13 篇文章 0 订阅

订阅专栏

c语言学习篇

7 篇文章 0 订阅

订阅专栏

Ⅱ 用剩余的N-K个元素依次与堆顶元素来比较，不满足则替换堆顶元素

堆排序

所谓堆排序，即是使用堆的思想来进行排序。

在堆中，我们逻辑上想象他是一棵树，但实际在物理上它是一个数组。

思路详解

Ⅰ 建堆

如果我们要将数据升序排列，那我们需要建大堆，如果降序排列，则建小堆。

升序：建大堆；

降序：建小堆。

Ⅱ 利用堆的删除思想来进行排序

以升序为例，假设此时我们已经完成了大堆的创建。

还记得堆是如何删除的吗？

我们将堆顶与堆尾互换，然后删除堆尾，再向下调整。

但在堆排序中，我们互换之后并不删除堆尾，只是不再对堆尾进行操作。

试想，一个大堆，堆顶元素自然是最大的数据，当我们交换堆顶堆尾，最大的元素就到了堆尾，我们不再对其进行操作，逻辑上将其暂时剥离数组，随后再进行向下调整。循环往复。

我们来画图看看：

功能接口

有关堆的一些基础特性可查看我的另一篇文章。数据结构之树 --- 二叉树-CSDN博客

向上调整算法

该接口建堆时使用。

//小堆
void SmaADjustUP(int* a, int child)
{
	int parent = (child - 1) / 2;
	while (child >= 0)
	{
		if (a[child] < a[parent])
		{
			swap(&a[child], &a[parent]);
			child = parent;
			parent = (parent - 1) / 2;
		}
		else
			break;
	}
}

向下调整算法

void SmaADjustDown(int *a,int size,int parent)
{
	int child = parent * 2 + 1;
	while (child < size)
	{
		if (child+1 < size && a[child] > a[child + 1])
		{
			child = child + 1;
		}
		if (a[child] < a[parent])
		{
			swap(&a[child], &a[parent]);
			parent = child;
			child = parent * 2 + 1;
		}
		else
			break;
	}
}

当然，只使用向下调整算法也是可以的。

主函数

步骤操作在代码中有注释。

int main()
{
	int a[10] = { 2,5,3,9,6,8,7,1,10 };
	int len = 10;
	for (int i = 0; i < len; i++)//建堆
	{
		BigADjustUP(a,i);
	}
	while(len>0)
	{
		swap(&a[0], &a[len - 1]);//交换堆顶与堆尾
		BigADjustDown(a, len - 1, 0);//向下调整，注意此时传入的数组大小为len-1，并未将堆尾传入
		                            //即向下调整时不包括堆尾
		len--;//剥离堆尾
	}
	for (int i = 0; i < 10; i++)//打印操作
	{
		printf("%d ", a[i]);
	}
	return 0;
}

运行结果展示

TOP - K问题

TOP-K问题：即求数据集合中前K个最大的元素或者最小的元素，一般情况下数据量都比较大。

比如：专业前10名、世界500强、富豪榜、游戏中前100的活跃玩家等。
对于Top-K问题，能想到的最简单直接的方式就是排序，但是：如果数据量非常大，排序就不太可取了(可能数据都不能一下子全部加载到内存中)。最佳的方式就是用堆来解决，

思路详解

Ⅰ 用数据集合中前K个元素来建堆

前k个最大的元素，则建小堆
前k个最小的元素，则建大堆

Ⅱ 用剩余的N-K个元素依次与堆顶元素来比较，不满足则替换堆顶元素

将剩余N-K个元素依次与堆顶元素比完之后，堆中剩余的K个元素就是所求的前K个最小或者最大的元素。

以建小堆为例，我们要求前5个最大的元素。

假设此时我们已经建好5个元素的小堆，将剩余的元素依次与堆顶进行比较，如果大于堆顶，则与堆顶交换，然后进行向下调整算法，使堆时刻保持特性。直至集合中的数据全部比较完成，此时堆中的五个数就是数据集合中最大的五个数。

我们来看看例子

按照上图方法比对，直至数据集合结束。

功能接口

建小堆所需的向上调整算法

向下调整算法

以上两个函数接口在堆排序中已经给出来了。

创建数据集合的文件创建接口

由于TOP-K问题一般用来处理大数据，因此我们需要创建一个乱序的含有大量数据的数据集合。

我们创建一个文件，向文件内写入一定数量的随机值，然后对文件中的数据进行操作。

void CreateFile(int n)
{
	srand(time(0));
	//const char* file = "data.txt";
	FILE* fin = fopen("data.txt", "w");
	
	if (fin == NULL)
	{
		perror("fopen error");
		return;
	}
	for (int i = 0; i < n; i++)
	{
		int num = (rand() + i) % 10000;
		fprintf(fin, "%d\n", num);
	}
	fclose(fin);
}

该过程我们需要用到 rand() 函数。

堆排序接口

将最后小堆中的数据进行升序排列

void heapSort(int* a, int len)
{
	int size = len;
	for (int i = 0; i < size; i++)
	{
		swap(&a[0], &a[len - 1]);
		SmaADjustDown(a, len - 1, 0);
		len--;
	}
	for (int i = 0; i < size; i++)
	{
		if (i % 5 == 0)
			printf("\n");
		printf("%d ", a[i]);
	}
}

TOP-K

在该函数中，我们调用创建文件接口，完成数据集合文件的创建，然后取k个数建堆。

接下来将剩下的数据依次与堆顶比对，向下调整。

void PrintTopk(int n,int k)
{
	CreateFile(n);//创建数据集合的文件
	FILE* fout=fopen("data.txt", "r");
	if (fout == NULL)
	{
		perror("fopen errorPrint");
		return;
	}
	int* a = (int*)malloc(sizeof(int) * k);//开辟堆空间

	for (int i = 0; i < k; i++)//建k个数的堆
	{
		fscanf(fout,"%d",&a[i]);
		SmaADjustUP(a, i);
	}
	int tmp = 0;
	while (fscanf(fout, "%d", &tmp)!=EOF)//直至文件内的数据取完
	{
		if (tmp > a[0])
		{
			a[0] = tmp;
			SmaADjustDown(a, k, 0);
		}
	}
	heapSort(a, k);
	free(a);
	fclose(fout);
}