基本概念:
1、完全二叉树:若二叉树的深度为h,则除第h层外,其他层的结点全部达到最大值,且第h层的所有结点都集中在左子树。
2、满二叉树:满二叉树是一种特殊的的完全二叉树,所有层的结点都是最大值。
堆树的定义:
1、堆是一颗完全二叉树。
2、堆中的某个结点的值总是大于等于(最大堆)或小于等于(最小堆)其孩子结点的值。
3、堆中每个结点的子树都是堆树。
构造最大堆
对于一个给定的数据 Arr = {5, 1, 13, 3, 16, 7, 10, 14, 6, 9}
,如何构造出一个最大堆呢?
首先它是一颗完全二叉树,因此我们可以使用顺序存储.对应的完全二叉树如下图:
注意: 在二叉树中,若当前节点的下标为 i, 则其父节点的下标为 i/2,其左子节点的下标为 i*2,其右子节点的下标为i*2+1;
开始构造最大堆:
- 首先我们需要找到最后一个结点的父结点如图(a),我们找到的结点是
16
,然后找出该结点的最大子节点与自己比较,若该子节点比自身大,则将两个结点交换.图(a)中,16
是最大的结点,不需要交换. - 我们移动到第下一个父结点
3
,如图(b)所示.同理做第一步的操作,交换了3和14,结果如图(c)所示. - 移动结点到下一个父结点13,如图(d)所示,发现不需要做任何操作,
- 移动到下个父结点1,如图(e)所示,然后交换1和16,如图(f)所示,此时我们发现交换后,1的子节点并不是最大的,我们接着在交换(如图g)所示
- 移动到父结点到5,一次重复上述步骤,交换5和16,在交换14和5,在交换5和6所有节点交换完毕,最大堆构建完成
初始化最大堆:
typedef int ElementType;
typedef struct HeapStruct *MaxHeap;
struct HeapStruct {
//指向一个数组
ElementType *Element;
//堆当前元素的个数
int size;
//堆的最大容量
int capacity;
};
int maxIndex(int left, int right, MaxHeap heap);
void initHeap(int *arr, int size, MaxHeap &heap, int maxCapacity) {
heap = (MaxHeap)malloc(sizeof(HeapStruct));
heap->capacity = maxCapacity;
heap->Element = new ElementType[maxCapacity+1];
heap->size = size;
//第一个位置不存任何数据,交换结点时可以作为中间变量
heap->Element[0] = 0;
//构建完全二叉树
for (int i = 0; i < size; i++) {
heap->Element[i+1] = arr[i];
}
//寻找最后一个结点的父结点,作为初始值
for (int pIndex = heap->size / 2; pIndex >= 1; pIndex--) {
int tmp = pIndex;
while ((tmp<<1) <= heap->size) { //表示该结点有孩子结点-->当该结点时叶子结点时,循环结束
//寻找这个结点的最大子结点
int maxChildIndex = 0;
if ((tmp<<1) + 1 > heap->size) { //没有右孩子,则左孩子就是最大子结点
maxChildIndex = (tmp<<1);
} else {//从左右孩子中寻找最大子结点
maxChildIndex = maxIndex(tmp<<1, (tmp<<1) + 1, heap);
}
//比较最大子结点和当前父结点,如果父结点的值小于最大子结点的值,则交换两个结点
if (heap->Element[tmp] < heap->Element[maxChildIndex]) {
//交换两个结点
heap->Element[0] = heap->Element[tmp];
heap->Element[tmp] = heap->Element[maxChildIndex];
heap->Element[maxChildIndex] = heap->Element[0];
heap->Element[0] = 0;
tmp = maxChildIndex;
} else {
break;//当该结点不需要在交换时,结束向下查找
}
}
}
}
int maxIndex(int left, int right, MaxHeap heap) {
return heap->Element[left] > heap->Element[right] ? left : right;
}
应用场景:如何从100w的数据中找出最大的100个?
1、先取出100个数,建立最小堆。
2、依次读取剩余的数据,与堆顶元素进行对比,若小于堆顶元素,则丢弃,否则替换堆顶元素,重新维护最小堆。
3、重复步骤2,直到遍历完所有的数据。