堆的构建(C语言版)

前言

堆是一种重要的数据结构,现实中我们通常把堆(一种二叉树)使用顺序结构的数组来存储。需要注意的是这里的堆和操作系统虚拟进程地址空间中的堆(堆区)是两回事,一个是数据结构,一个是操作系统中管理内存的一块区域分段。

我个人也是在前段时间刚刚结束了堆的学习,不得不说的是堆的难度相较于数据结构前期所学的顺序表、链表、栈、队列等要更上一个台阶。不过在更深层次的学习完之后明显感觉到这东西是真的好用,尤其是在排序方面,大大的提高排序的效率。

堆部分所面临的的第一个难点就是堆的构建,本篇文章中博主会主要向大家讲解构建堆的过程,同时围绕着这一点介绍一些堆的相关知识。

下面开始介绍。


1.认识堆

1.1 堆的概念

如果有一个关键码的集合K = {k0,k1, k2,…,kn-1},把它的所有元素按完全二叉树的顺序存储方式存储在一个一维数组中,并满足:Ki <= K2i+1 且 Ki<= K2i+2 (Ki >= K2i+1 且 Ki >= K2i+2) i =0,1,2…,则称为小堆(或大堆)。将根节点最大的堆叫做最大堆或大根堆,根节点最小的堆叫做最小堆或小根堆。

纯看概念的话确实有些难以理解,仅供参考。大家先记下堆分为大根堆和小根堆。

1.2 堆的性质

下面我们来看堆的两个重要性质:

  • 堆中每个结点的值总是不大于或不小于其父结点的值。
  • 堆总是一棵完全二叉树

1.3 大根堆和小根堆

上面我提到堆有两种类型大根堆和小根堆,下面我们来看这两种结构究竟是如何构成的。

大根堆:堆中每个结点的值总是不大于其父结点的值。
在这里插入图片描述

小根堆:堆中每个结点的值总是不小于其父结点的值。
在这里插入图片描述

2. 建堆

2.1 设计堆结构

现实中我们通常把堆用线性数组来存储,所以堆的底层结构就是一个静态顺序表。

实现代码如下:

typedef int HPDataType;

typedef struct Heap
{
	HPDataType* _a;
	int _size;
	int _capacity;
}Heap;

堆结构一共三个成员:指向动态开辟数组的指针,数组有效数和数组容量。

2.2 向下调整算法

向下调整算法是建堆的重要思想,用来生成大堆或者小堆,所以一开始我们先来了解一下向下调整算法的思路。

现在给出一个数组,逻辑上将它看做一棵完全二叉树。接下来我们从根结点开始用向下调整算法将它调整成一个小堆。

注意:向下调整算法有一个前提,左右子树必须是一个堆,才能调整

int a[] = {27, 15, 19, 18, 28, 34, 65, 49, 25, 37};

该数组表示的二叉树结构如下图所示:
在这里插入图片描述
注意观察可以发现,根结点27的左右子树都是小堆,所以可以对根结点27进行向下调整来将这棵完全二叉树变成小堆。

来看调整示意图:
在这里插入图片描述
上图以生成小堆为例,第一步先找到根27两个左右孩子中较小的一个15,然后判断根结点和孩子结点的大小,如果根结点的值大于孩子的值,就将根结点和孩子结点交换位置;如果小于说明小堆已经生成了,结束判断。

第一步交换完之后,继续重复上一步的操作判断原根结点,依次类推进行调整,直至判断到叶子结点,或者提前形成小堆。

生成小堆实现代码如下:

void Swap(HPDataType* p1, HPDataType* p2)
{
	HPDataType tmp = *p1;
	*p1 = *p2;
	*p2 = tmp;
}

// 前提:左右子树的都是小堆
void AdjustDown(HPDataType* a, int n, int root)
{
	int parent = root;
	int child = parent * 2 + 1; // 左孩子

	while (child < n)
	{
		// 找出左右孩子中小的那一个
		if (child + 1 < n && a[child + 1] < a[child])
		{
			++child;
		}

		// 如果孩子小于父亲则交换
		if (a[child] < a[parent])
		{
			Swap(&a[child], &a[parent]);
			parent = child;
			child = parent * 2 + 1;
		}
		else
		{
			break;
		}
	}
}

定义两个下标,一个是根结点的下标,一个是孩子下标。一开始先默认左右两个孩子的较小者是左孩子,再进入循环判断。循环正常的结束条件应该是当前结点为叶子结点,而如果该结点是叶子结点,那么它的孩子下标应该是大于堆结点总数的,可以利用这一点作为循环的判断条件。

在循环内部判断左右子孩子大小的时候可能会有一种特殊情况,比如当前要判断的结点是28,该结点只有一个左孩子而没有右孩子,这个时候如果在判断左右孩子大小时用右孩子下标去访问数组的话就会出现越界访问的情况,因为数组中没有这个右孩子(小细节一定要注意)。因此在判断左右两个孩子大小的时候的时候还要判断右孩子是否存在。

数据的交换可以封装一个交换函数来进行,交换完之后孩子位置成为新的根结点,再找到该结点的左孩子作为新的孩子结点不断迭代进行判断。

如果没有发生交换,说明小堆已经生成,结束循环即可。

2.3 堆的构建

学会向下调整算法之后我们来看如何利用向下调整算法构建堆。

下面给出一个数组,这个数组逻辑上可以看做一棵完全二叉树,但是还不是一个堆,现在我们通过算法,把它构建成一个堆。

int a[] = {1,5,3,8,7,6};

该数组的二叉树结构如下:
在这里插入图片描述
根结点的左右子树不是堆,我们应该怎么调整呢?这里我们从第一个非叶子节点的子树(根结点为3的子树)开始调整,因为此时该子树的左右两棵子树只有一个结点,所以可以默认为大堆或者小堆一直调整到根结点的树,就可以调整成堆。

来看建堆示意图:
在这里插入图片描述
实现代码如下:

void HeapInit(Heap* php, HPDataType* a, int n)
{
	php->_a = (HPDataType*)malloc(sizeof(HPDataType)*n);
	// ...
	memcpy(php->_a, a, sizeof(HPDataType)*n);
	php->_size = n;
	php->_capacity = n;

	// 构建堆
	for (int i = (n - 1 - 1) / 2; i >= 0; --i)
	{
		AdjustDown(php->_a, php->_size, i);
	}
}

我们知道堆是使用顺序表实现的,一开始先利用memcpy函数将所给的数组拷贝到顺序表内动态开辟的数组中去,然后初始化有效数size和容量capacity的值。

接下来要做的就是从第一个非叶子结点子树的根开始调整,调整方法就是利用上面所写的向下调整方程,将以该结点为根结点的子树调整成堆的形式。

当前结点调整完之后再来调整该结点左边的结点,通过数组下标进行遍历,依次类推,直到将该二叉树的根结点调整过之后,说明堆的生成结束。

这里只需采用一个简单的for循环来进行遍历即可,需要注意的是,在数组中,第一个非叶子结点子树根的下标为(n - 1 - 1) / 2二叉树根结点的下标是0,所以当结点下标小于0的时候就可以停止遍历了

2.4 建堆的时间复杂度

该建堆方式是从倒数第二层的结点(叶子结点的上一层)开始,从右向左,从上到下的向下调整。

同样的,假设该队为满二叉树,堆高为h。

则建堆的时间复杂度t(n) = 1 × (h - 1)+ 2 ×(h - 2) + 4 × (h - 3) + …+ 2h-2 × 1 = 20 × (h - 1) + 21 × (h - 2) +22 × (h - 3) + …+ 2^h - 2^ × 1

可以看到最终的式子是一个差比数列,因此使用错位相减法,得到的时间复杂度为:t(n) = 2h - h - 1 = n - log(n + 1).

即时间复杂度为T(n) = n.

这里再简单解释一下:按照最坏情况计算,第一层一个元素,每个元素需要向下调整(h-1)次,第二层两个元素,每个元素需要调整(h-2)次,第三层4个元素,每个元素需要调整(h-3)次,而倒数第二层共2^(h-2)个元素,每个元素需要调整1次,将所有的次数加起来,最后计算出时间复杂度为O(N)。

本篇文章到这里就结束了,最后希望能够为大家带来帮助。

  • 6
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值