二叉堆的定义
二叉堆是完全二叉树或者是近似完全二叉树。
二叉堆满足二个特性:
1.父结点的键值总是大于或等于(小于或等于)任何一个子节点的键值。
2.每个结点的左子树和右子树都是一个二叉堆(都是最大堆或最小堆)。
当父结点的键值总是大于或等于任何一个子节点的键值时为最大堆。当父结点的键值总是小于或等于任何一个子节点的键值时为最小堆。下图展示一个最小堆:
由于其它几种堆(二项式堆,斐波纳契堆等)用的较少,一般将二叉堆就简称为堆。
堆的存储
一般都用数组来表示堆,i结点的父结点下标就为(i – 1) / 2。它的左右子结点下标分别为2 * i + 1和2 * i + 2。如第0个结点左右子结点下标分别为1和2。
堆的操作——插入删除
堆的插入
每次插入都是将新数据放在数组最后。可以发现从这个新数据的父结点到根结点必然为一个有序的数列,现在的任务是将这个新数据插入到这个有序数据中——这就类似于直接插入排序中将一个数据并入到有序区间中。
// 新加入i结点 其父结点为(i - 1) / 2
void MinHeapFixup(int a[], int i)
{
int j, temp;
temp = a[i];
j = (i - 1) / 2; //父结点
while (j >= 0 && i != 0)
{
if (a[j] <= temp)
break;
a[i] = a[j]; //把较大的子结点往下移动,替换它的子结点
i = j;
j = (i - 1) / 2;
}
a[i] = temp;
}
插入时:
//在最小堆中加入新的数据nNum
void MinHeapAddNumber(int a[], int n, int nNum)
{
a[n] = nNum;
MinHeapFixup(a, n);
}
堆的删除
按定义,堆中每次都只能删除第0个数据。为了便于重建堆,实际的操作是将最后一个数据的值赋给根结点,然后再从根结点开始进行一次从上向下的调整。调整时先在左右儿子结点中找最小的,如果父结点比这个最小的子结点还小说明不需要调整了,反之将父结点和它交换后再考虑后面的结点。相当于从根结点将一个数据的“下沉”过程。下面给出代码:
// 从i节点开始调整,n为节点总数 从0开始计算 i节点的子节点为 2*i+1, 2*i+2
void MinHeapFixdown(int a[], int i, int n)
{
int j, temp;
temp = a[i];
j = 2 * i + 1;
while (j < n)
{
if (j + 1 < n && a[j + 1] < a[j]) //在左右孩子中找最小的
j++;
if (a[j] >= temp)
break;
a[i] = a[j]; //把较小的子结点往上移动,替换它的父结点
i = j;
j = 2 * i + 1;
}
a[i] = temp;
}
//在最小堆中删除数
void MinHeapDeleteNumber(int a[], int n)
{
Swap(a[0], a[n - 1]);
MinHeapFixdown(a, 0, n - 1);
}
堆化数组
有了堆的插入和删除后,再考虑下如何对一个数据进行堆化操作。要一个一个的从数组中取出数据来建立堆吧,不用!先看一个数组,如下图:
很明显,对叶子结点来说,可以认为它已经是一个合法的堆了即20,60, 65, 4, 49都分别是一个合法的堆。只要从A[4]=50开始向下调整就可以了。然后再取A[3]=30,A[2] = 17,A[1] = 12,A[0] = 9分别作一次向下调整操作就可以了。下图展示了这些步骤:
//建立最小堆
void MakeMinHeap(int a[], int n)
{
for (int i = n / 2 - 1; i >= 0; i--)
MinHeapFixdown(a, i, n);
}
至此,堆的操作就全部完成了(注1),再来看下如何用堆这种数据结构来进行排序。
堆排序
首先可以看到堆建好之后堆中第0个数据是堆中最小的数据。取出这个数据再执行下堆的删除操作。这样堆中第0个数据又是堆中最小的数据,重复上述步骤直至堆中只有一个数据时就直接取出这个数据。
由于堆也是用数组模拟的,故堆化数组后,第一次将A[0]与A[n - 1]交换,再对A[0…n-2]重新恢复堆。第二次将A[0]与A[n – 2]交换,再对A[0…n - 3]重新恢复堆,重复这样的操作直到A[0]与A[1]交换。由于每次都是将最小的数据并入到后面的有序区间,故操作完成后整个数组就有序了。有点类似于直接选择排序。
void MinheapsortTodescendarray(int a[], int n)
{
for (int i = n - 1; i >= 1; i--)
{
Swap(a[i], a[0]);
MinHeapFixdown(a, 0, i);
}
}
注意使用最小堆排序后是递减数组,要得到递增数组,可以使用最大堆。
由于每次重新恢复堆的时间复杂度为O(logN),共N - 1次重新恢复堆操作,再加上前面建立堆时N / 2次向下调整,每次调整时间复杂度也为O(logN)。二次操作时间相加还是O(N * logN)。故堆排序的时间复杂度为O(N * logN)。
完整代码:
#include <iostream>
using namespace std;
//堆调整,构建大顶堆,arr[]是待调整的数组
//i是待调整的数组元素的位置[节点?],length是数组的长度
void HeapAdjust(int arr[], int i, int length)
{
int Child;
int temp;
for(;2 * i + 1 < length; i = Child)
{
//子节点的位置 = 2 * (parent(父结点)) + 1
Child = 2 * i + 1;
//得到子结点中较大的结点
if(Child < length - 1 && arr[Child + 1] > arr[Child])
++Child;
//如果较大的子结点大于父结点那么把较大的子结点往上移动
//替换它的父结点
if(arr[i] < arr[Child])
{
temp = arr[i];
arr[i] = arr[Child];
arr[Child] = temp;
}
else
break;
}
}
//堆排序算法
void HeapSort(int arr[], int length)
{
int i;
//调整序列的前半部分元素,调整完之后第一个元素
//是序列的最大元素,length/2-1是最后一个非叶子结点
for(i = length/2 - 1; i >= 0; --i)
HeapAdjust(arr, i, length);
//从最后一个元素开始对序列进行调整,不断的缩小调整
//的范围直到第一个元素
//循环里是把第一个元素和当前的最后一个元素交换
//保证当前的最后一个位置的元素是现在这个序列的最大的
//不断的缩小调整heap的范围,每一次调整完毕保证第一个
//元素是当前序列的最大的元素
for(i = length - 1; i > 0; --i)
{
arr[i] = arr[0]^arr[i];
arr[0] = arr[0]^arr[i];
arr[i] = arr[0]^arr[i];
HeapAdjust(arr, 0, i); //递归调整
}
}
int main()
{
int i;
int num[] = {98, 48, 777, 63, 57, 433, 23, 1112, 1};
cout<<"==================堆排序=============="<<endl;
cout<<"实质上是一颗完全二叉树,利用树的根结点"<<endl;
cout<<"与子节点的性质进行排序"<<endl;
cout<<"==================堆排序=============="<<endl;
cout<<"待排序的数据是:"<<endl;
for(i = 0; i < sizeof(num)/sizeof(int); i++)
{
cout<<num[i]<<endl;
}
cout<<endl;
HeapSort(num, sizeof(num)/sizeof(int));
cout<<"排序后的数据是:"<<endl;
for(i = 0; i < sizeof(num)/sizeof(int); i++)
{
cout<<num[i]<<" ";
}
cout<<endl;
return 0;
}
运行结果: