堆排序是利用堆积树这种数据结构设计的一种算法。
要学习堆排序,我们首先要了解什么是二叉堆:
二叉堆是完全二叉树这这是近似完全二叉树。二叉堆可分为两种形式:最大堆和最小堆。
最大堆的性质是指某个结点的值至多与起父结点的值一样大,最小堆的性质就是指某个节点的值都大于其父结点的值。下图是一个最大堆和一个最小堆。
在堆排序中我们一般使用最大堆。我们要进行堆排序,首先需要把我们的数组转化成一个最大堆,这就是建堆的过程,在建堆过程中,最要中的部分就是怎么维护最大堆的性质。
有时候根结点left(i)和right(i)的二叉树都是最大堆,但是这时有可能A[i],小于它的孩子,这样就违背了最大堆的性质,我们可以通过heapify的过程来保证最大堆的性质:
例如我们给出一个数组a[i] i从1到10
#include<iostream>
#include<cstdio>
#include<algorithm>
using namespace std;
void heapify(int a[], int i)
{
int l = 2*i;
int r = 2*i+1;
int largest;
if(l<=10 && a[l] > a[i])
largest = l;
else
largest = i;
if(r<=10 && a[r] > a[largest])
largest = r;
if(largest != i)
{
swap(a[i], a[largest]);
heapify(a, largest);
}
}
int main()
{
int a[11] = {0, 4, 16, 10, 14, 7, 9, 3, 2, 8, 1};
heapify(a, 1);
for(int i=1;i<11;i++)
cout << a[i] << " ";
return 0;
}
操作过程如下图:
我们知道怎样维护最大堆的性质之后,我们就可以用底向上的方法来把一个数组转化为最大堆,这就是我们的建堆过程buildheap:
void buildheap(int a[])
{
for(int i=5;i>=1;i--)
heapify(a, i);
}
这样我们便将一个数组转化为了最大堆,那么我们最后的堆排序的过程是怎么样的:
通过建堆的过程我们把数组构建成了一个最大堆,对的元素总是在数组的第一个,我们可以通过把它和其他元素互换,将它放到正确的位置,这时如果我们去掉这个节点,在剩下的结点中,原来根的孩子还是最大堆,但是新的根结点有可能违背最大堆的性质,所以我们重复调用heapify过程,直到堆的大小从 n-1降到2,这时我们便完成了排序:
#include<iostream>
#include<cstdio>
#include<algorithm>
using namespace std;
int size;
int length;
void heapify(int a[], int i)
{
int l = 2*i+1;
int r = 2*i+2;
int largest;
if(l<=size && a[l] > a[i])
largest = l;
else
largest = i;
if(r<=size && a[r] > a[largest])
largest = r;
if(largest != i)
{
swap(a[i], a[largest]);
heapify(a, largest);
}
}
void buildheap(int a[])
{
size = length - 1;
for(int i=length/2-1;i>=0;i--)
heapify(a, i);
}
void heapsort(int a[])
{
buildheap(a);
for(int i=length-1;i>=1;i--)
{
swap(a[0], a[i]);
size--;
heapify(a, 0);
}
}
int main()
{
int a[10] = {4, 1, 3, 2, 16, 9, 10, 14, 8, 7};
length = sizeof(a) / sizeof(int);
heapsort(a);
for(int i=0;i<10;i++)
cout << a[i] << " ";
return 0;
}
堆排序的时间,主要由建立初始堆和反复重建堆这两部分的时间开销构成,它们均是通过调用heapify实现的。
平均时间复杂度为:O(N*logN)。
由于建初始堆所需的比较次数较多,所以堆排序不适宜于记录数较少的文件。
堆排序是就地排序,辅助空间为O(1).
它是不稳定的排序方法。(排序的稳定性是指如果在排序的序列中,存在前后相同的两个元素的话,排序前 和排序后他们的相对位置不发生变化)