1、基础知识
通常把堆(一棵完全二叉树)使用顺序结构的数组来存储,这里的堆和操作系统虚拟进程地址空间中的堆是不一样的,一个是数据结构;一个是操作系统中管理内存的一块区域分段。
堆的性质:
1、堆是一棵完全二叉树
2、堆中某个节点的值总是不大于或者不小于其父节点的值
1.1大根堆和小根堆
堆的结构可以分为大根堆和小根堆,堆排序就是根据堆的这种数据结构设计的一种排序。若堆中的每个结点的值总是大于等于其左孩子和右孩子的值就是大根堆(最大堆);若每个结点的值总是小于等于其左孩子和右孩子的值就是小根堆(最小堆)。
小根堆:
大根堆:
2、堆的实现
2.1堆的向下调整算法
向下调整算法有一个前提:其左右子树必须是一个堆,才能进行调整。因此可以通过从根节点开始的向下调整算法,可以把它调整成一个小堆,。
假设给出数组a[]= {27,15,19,18,28,34,65,49,25,37},其对应的完全二叉树为:
由上图可以看出,经过向下调整算法成为一个小堆,其就是不断地对比父节点和它的左右节孩子中较小的值进行交换。
2.1.1代码
//向下调整算法
void ADjustDown(HpDataType* a,size_t n, int root)
{
int parent = root;
int child = 2 * parent + 1;
while (child<n)
{
//找出左右孩子中小的那个
if (child + 1<n&&a[child]>a[child + 1])
{
child++;
}
//调整:1、孩子比父亲小则交换,继续下调 2、孩子比父亲大,则终止
if (a[parent]>a[child])
{
HpDataType tmp = a[parent];
a[parent] = a[child];
a[child] = tmp;
parent = child;
child = parent * 2 + 1;
}
else
{
break;
}
}
}
2.2堆的创建
数组逻辑上可以看成一棵完全二叉树,但不一定是一个堆,根节点左右子树不是堆,就需要从倒数的第一个非叶子节点开始进行调整,一直到根节点为止,将每一个节点及其子树调整到满足小堆的性质即可。
假设给出数组a[]= {5,11,7,2,3,17},将其变成大根堆如图所示:
注意每次交换后,都要对下一层的子堆进行递归调整,因为交换后有可能破坏已调整子堆的结构。
查找数组中某个数的父结点和左右孩子结点,比如已知索引为i的数,那么
其父结点=(i-1)/2;其左孩子=2i+1;其右孩子=2i+2。
2.2.1代码
void HeapSort(int *a, int n)
{
//建堆
for (int i = (n - 2) / 2; i >= 0; --i)
{
ADjustDown(a, n, i);
}
for (int i = 0; i < n; i++)
{
printf("%d ", a[i]);
}
}
3、堆排序
堆排序是利用堆这种数据结构而设计的一种排序算法,堆排序是一种选择排序。要得到降序:建小堆选出最小,交换到最后并不看成堆里的数,继续调堆选出次小,再交换到倒数第二个,不断重复。得到升序:建大堆选出最大,交换到最后并不看成堆里的数,继续调堆选出次大,再交换到倒数第二个,不断重复。
3.1堆排序举例
以数组按降序(建小堆)进行堆排序:首先将待排序的数组构造成一个小根堆,整个数组的最小值就是堆的根节点。将其与末尾的数交换,此时末尾就为最小值。然后再将剩余n-1个元素重新构造成一个堆,反复执行,便能得到一个有序序列。
继续以上一次给出的数组a[]= {5,11,7,2,3,17},降序排序:
3.2代码
void HeapSort(int* a, int n)
{
//从最后一个非叶子节点建堆
for (int i = (n - 2) / 2; i >= 0; --i)
{
ADjustDown(a, n, i);
}
int end = n - 1;
while (end>0)
{
int tmp = a[end];
a[end] = a[0];
a[0] = tmp;
ADjustDown(a, end, 0);
--end;
}
for (int i = 0; i < n; i++)
{
printf("%d ", a[i]);
}
}
结果:
初始状态:
5 11 7 2 3 17
建堆之后:
2 3 7 11 5 17
排序之后:
17 11 7 5 3 2
3.3总结
堆排序的基本思路:
1.将无序数组构建成一个堆,根据升序降序需求选择大根堆或小根堆。
2.将堆顶元素与末尾元素交换,将最大元素"沉"到数组末端。
3.重新调整结构,使其满足堆定义,然后继续交换堆顶元素与当前末尾元素,反复执行调整+交换步骤,直到整个序列有序。