数据结构中的堆

文章介绍了二叉树的基本概念,包括节点的度、完全二叉树和满二叉树的定义,以及二叉树的性质。接着讲解了堆,特别是完全二叉树在堆数据结构中的应用,如何通过数组存储堆,并提供了插入、删除等基本操作的实现。最后提到了堆在堆排序和TopK问题中的应用。
摘要由CSDN通过智能技术生成

一、树的重要知识点

节点的度:一个节点含有的子树的个数称为该节点的度(有几个孩子)
叶节点或终端节点:度为0的节点称为叶节点;如上图:B、C、H、I...等节点为叶节点(0个孩子)
非终端节点或分支节点:度不为0的节点; 如上图:D、E、F、G...等节点为分支节点
父节点:若一个节点含有子节点,则这个节点称为其子节点的父节点; 上图:A是B的父节点
孩子节点或子节点:一个节点含有的子树的根节点称为该节点的子节点; 上图:B是A的孩子节点
兄弟节点:具有相同父节点的节点互称为兄弟节点; 如上图:B、C是兄弟节点(亲兄弟)
树的度:一棵树中,最大的节点的度称为树的度; 如上图:树的度为6(最多有几个孩子)
节点的层次:从根开始定义起,根为第1层,根的子节点为第2层,以此类推;
树的高度或深度:树中节点的最大层次; 如上图:树的高度为4(H表示,从1开始)
堂兄弟节点:双亲在同一层的节点互为堂兄弟;如上图:H、I互为兄弟节点
节点的祖先:从根到该节点所经分支上的所有节点;如上图:A是所有节点的祖先
子孙:以某节点为根的子树中任一节点都称为该节点的子孙。如上图:所有节点都是A的子孙
森林:由m(m>0)棵互不相交的树的集合称为森林;


二、二叉树

二叉树的度,孩子最多为2,可以是0、1、2,只有一个孩子是左/右孩子均可,上面是二叉树的所有可能组成部分。

1、完全二叉树&满二叉树

满二叉树有h层,且每层的结点都是满的。共  2^h-1个结点

完全二叉树有h层,前h-1层满,最后一层最少一个,结点n的范围是        2^(h-1)<=n<= 2^h-1

2、二叉树的性质 (几个公式)

首先,设孩子为0/1/2的结点总数分别为N0/N1/N2

可得  N0 = N2+1  该等式恒成立。  N1的数量是不确定的。

但是对于满二叉树。N1=0,  观察一下图就知道了。

对于完全二叉树,N1 = 0或1.

二叉树的深度H: H=logN(约等于),所以从上到下遍历一遍的时间复杂度为O(logN)

3、孩子与父亲的关系(互相查找)

假设将二叉树的结点,从上到下,从左到右,从0开始标记结点的个数,设孩子下标为child,父亲的下标为parent,则有以下关系

1、parent = (child-1)/ 2     左右孩子均满足

2、左孩子:  child = 2*parent +1

3、右孩子:  child = 2*parent +2

同时,如果结点总数为n,此时把n看作是下标,child必须<n,孩子结点才能存在,即 0~n-1

三、堆的概念

1、二叉树的顺序存储结构

 与链表类似,堆这种数据结构也是分为物理结构和逻辑结构。

逻辑结构上是一棵完全二叉树,物理结构上是顺序表。

上图中为普通二叉树的两种结构,完全二叉树以及非完全二叉树。

对于非完全二叉树,我们如果用数组存储,最坏的情况有一棵树每层只有一个结点,即有几个结点就有多少层,就要开2^n大小的空间,空间有巨大的浪费,只能使用链表结构实现。

而对于完全二叉树,最大的空间浪费也就是一半左右。由于完全二叉树是相对固定的结构,而且又有一些实际用途,我们把它单独拿出来,命名为堆。

2、堆的分类

 分为  大根堆和小根堆两种,即每个parent结点的val值的大小,都要比其child结点的val大或小。

四、堆的接口函数

typedef int HPDatatype;

typedef struct Heap
{
	HPDatatype* a;
	int capacity;
	int size;
}HP;

//堆的初始化
void HPInit(HP* php);
//堆的销毁
void HPDestroy(HP* php);
//入数据
void HPPush(HP* php, HPDatatype x);
//删除数据
void HPPop(HP* php);
//判断堆是否为空
bool HPEmpty(HP* php);
//返回堆中元素个数
int HPSize(HP* php);
//返回堆顶元素
HPDatatype HPTop(HP* php);
//交换2个数据
void Swap(HPDatatype* p1, HPDatatype* p2);
//向下调整
void AdjustDown(HPDatatype* a, int parent, int size);
//向上调整
void AdjustUp(HPDatatype* a, int child);

五、初始化

//堆的初始化
void HPInit(HP* php)
{
	assert(php);

	HPDatatype* tmp = (HPDatatype*)malloc(sizeof(HPDatatype) * 4);
	if (NULL == tmp)
	{
		perror("malloc fail");
		return ;
	}

	php->a = tmp;
	php->capacity = 4;
	php->size = 0;

}

堆的结构与顺序表类似,都是一个指针指向物理存储的数组,size表示现有数据的个数,capacity表示当前的容量。

malloc一段空间给指针a,然后调整size为0,capacity初始化为4个元素的大小。

六、插入数据

先判断物理空间上的存储是否足够,不够就增容。

在size位置插入数据后,要对数据进行向上调整操作 (向上调整的原因是为了维持堆的结构,因为插入的数据的值的大小是不确定的,如果不调整就会破坏堆的结构,因此从第二个数据开始,就要不断向上调整)。

传入的参数为a指向的数组,以及刚刚插入的,要调整的数据的下标

七、向上调整函数

传入child下标,通过parent = (child-1)/2找到其父亲结点的下标位置,因为这里以大根堆为例,因此,只要a[child]>a[parent]就交换,交换完后,孩子变为原来的父亲,父亲继续找他的父亲,这样向上迭代,直到child变为0,即堆顶,它就是堆中最大的元素了,没有调整空间了。或者是不满足孩子大于父亲的条件,直接跳出了。

交换函数

只是实现简单的两个元素的数据交换,注意函数的返回值类型,以及传入的是地址。

 八、删除数据

一开始的size是删除前堆中元素的总数,我这里先让size--,使其指向被删除的那个元素,然后交换堆顶元素和要删除的元素,最后对堆顶的元素进行向下调整操作。

实现时可以改变顺序,但是一定要保证前后逻辑的统一,包括下面的向下调整函数的实现。

九、向下调整函数

这里的size接收的是pop函数中的size-1,即现在的size为向下调整的数据范围,共size个。

因为交换数据后,最大的数据来到数组的最后位置,我们只是通过size--来避免访问他,并没有真正的将它删除,因此原来在数组最后,现在在堆顶的那个元素,在向下调整时不能包含被删除的那个元素。

函数过程分析:parent为向下调整的那个元素,先通过 child = parent*2+1找到它的左孩子,进入循环后先判断一步,找出左右孩子中较大的那个,其中,child+1<size是为了保证右孩子也在数组范围内,如果不在,就默认为左孩子大了。

找出较大的孩子后,将其val值与parent比较,如果大于parent就交换,然后父亲变为孩子,孩子继续向下迭代找他的孩子,直到child>=size,超出数组范围。

十、返回个数、堆顶、销毁函数

这几个函数很简单,与前面的几种数据结构相似,这里不多陈述。

十一、测试结果

 

 插入的结果为大堆。

 由于删除后不会访问最后一个元素,所以除了原来的最大值8外,其它7个数字仍然满足大堆结构

 

通过循环  取出堆顶元素+删除操作,可以获取所有堆顶元素。

 引入k变量可以取出k个堆顶元素,又因为堆顶元素都是堆中最大或最小的,因此可以解决后面的topk问题。

十二、函数实现具体代码

#include"Heap.h"

//堆的初始化
void HPInit(HP* php)
{
	assert(php);

	HPDatatype* tmp = (HPDatatype*)malloc(sizeof(HPDatatype) * 4);
	if (NULL == tmp)
	{
		perror("malloc fail");
		return ;
	}

	php->a = tmp;
	php->capacity = 4;
	php->size = 0;

}

//交换函数(交换父子数据)
void Swap(HPDatatype* p1, HPDatatype* p2)
{
	HPDatatype tmp = *p1;
	*p1 = *p2;
	*p2 = tmp;

}


//向上调整,任意传入一个下标,对它及其祖先进行向上调整,前提是左右子树都是  大/小堆
void AdjustUp(HPDatatype* a, int child)
{
	//chile 和 parent 都是下标的数字
	int parent = (child - 1) / 2;
	while (child > 0) //这里以大根堆为例(每个根都大于其子孙)
	{
		if (a[child] > a[parent])
		{
			//若大于则向上调整交换
			Swap(&a[child], &a[parent]);
			//交换后,调整 父子下标,方便继续向上调整
			child = parent;
			parent = (child - 1) / 2;
		}
		else
		{
			break;
		}
	}

}

//入数据
void HPPush(HP* php, HPDatatype x)
{
	assert(php);
	//先判断是否需要增容,如需要则增容
	if (php->size == php->capacity)
	{
		HPDatatype* tmp = (HPDatatype*)realloc(php->a, sizeof(HPDatatype) * 2 * (php->capacity));
		if (NULL == tmp)
		{
			perror("realloc fail");
			return;
		}
		php->a = tmp;
		php->capacity *= 2;
	}

	//入数据  先插入到尾部,即物理存储上数组的最后,然后向上调整
	php->a[php->size] = x;
	AdjustUp(php->a,php->size);
	php->size++;

}


//判断堆是否为空
bool HPEmpty(HP* php)
{
	return php->size == 0;
}

//向下调整,前提是左右子树都是  大/小堆
void AdjustDown(HPDatatype* a, int parent,int size)
{
	int child = parent * 2 + 1;
	while (child < size)//叶结点为止,叶节点没有孩子,即child下标超过数组范围
	{
		//先找出来2个子节点中较大的那一个,因为parent的值要和较大的比较
		//此时如果交换,值大的child变为parent,满足比他的兄弟大
		if ((child+1 < size) && a[child + 1]>a[child])//起始的child一定是左孩子,检查越界
		{
			child = child + 1;
		}
		//向下调整
		if (a[child] > a[parent])
		{
			Swap(&a[parent], &a[child]);
			parent = child;
			child = child * 2 + 1;//每次都从左边的节点开始
		}
		else
		{
			break;
		}

	}

}


//删除数据   删除堆顶的元素才有意义,根据大根堆和小根堆,可以得到top为max或min
void HPPop(HP* php)
{
	assert(php);
	assert(!HPEmpty(php));

	//删完之后还要保证为堆的结构
	//如果只是简单的向前覆盖,由于物理上是数组存储,就会导致堆的父子结构被打乱,  无法通过下标关系找父/子
	//无法进行后续删除,因此可以选择首尾元素交换,删除尾部后,堆顶元素向下调整
	php->size--;
	Swap(&php->a[0], &php->a[php->size]);
	AdjustDown(php->a, 0, php->size);


}


//返回堆中元素个数
int HPSize(HP* php)
{
	assert(php);
	return php->size;
}
//返回堆顶元素
HPDatatype HPTop(HP* php)
{
	assert(php);
	return php->a[0];
}

//堆的销毁
void HPDestroy(HP* php)
{
	assert(php);
	php->capacity = 0;
	php->size = 0;
	free(php->a);
}

//9 8 7 6 5 0 2 1 4 3

 今天讲的是堆的概念及其主要函数的实现,下一篇文章我将详细讲述堆的应用。如 堆排序、topk问题等,感谢各位看到最后。

  • 19
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 16
    评论
评论 16
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值