堆排序是利用堆的性质进行的一种树形选择排序。属于原址排序。
(1)堆的性质:
堆有两个性质,分别为结构性质和堆序性质。
结构性质:堆是一颗完全二叉树。
堆序性质(大顶堆):对任意节点x,x中的键值大于等于左子树节点或右子树节点中的键值。
(2)思路:
1)将初始待排序关键字序列(R1,R2....Rn)构建成大顶堆,此时堆顶元素R[1]为最大元素。
2)将堆顶元素R[1]与最后一个元素R[n]交换,此时得到新的无序区(R1,R2,......Rn-1)和新的有序区(Rn),且满足R[1,2...n-1]<=R[n]。
3)由于交换后新的堆顶R[1]可能违反了堆的性质,因此需要将无序区(R1,R2,......Rn-1)调整为新堆,然后将R[1]与无序区最后一个元素Rn-1交换,得到新的无序区(R1,R2....Rn-2)和新的有序区(Rn-1,Rn)。不断重复此过程直到有序区的元素个数为n-1,则整个排序过程完成。
因此对于堆排序,最重要的两个操作就是构造初始堆和调整堆,其实构造初始堆事实上也是调整堆的过程,只不过构造初始堆是对所有的非叶节点都进行调整。
(3)复杂度分析:
(3.1)时间复杂度:
O(nlogn)。
(3.2)空间复杂度:
O(1)。
(4)稳定性:
堆排序不是稳定的排序算法。
(5)性能总结:
堆排序适合于数据量非常大的场合(百万数据)。
堆排序不需要大量的递归或者多维的暂存数组。这对于数据量非常巨大的序列是合适的。比如超过数百万条记录,因为快速排序,归并排序都使用递归来设计算法,在数据量非常大的时候,可能会发生堆栈溢出错误。
堆排序会将所有的数据建成一个堆,最大的数据在堆顶,然后将堆顶数据和序列的最后一个数据交换。接下来再次重建堆,交换数据,依次下去,就可以排序所有的数据。
代码片段:
#include <iostream>
#include<algorithm>
using namespace std;
#define SIZE 6
void heap_sort(int* a,int size);
void build_heap(int* a,int size);
void heap_adjust(int* a,int i,int size);
int main(int argc, char *argv[])
{
int a[]={0,16,7,3,20,17,8}; //注意a[]有效元素从a[1]开始!!!
cout<<"排序前: "<<endl;
for(int i=1;i<=SIZE;i++)
{
cout<<a[i]<<" ";
}
cout<<endl;
cout<<"-------------------------------------"<<endl;
heap_sort(a,SIZE);
cout<<"-------------------------------------"<<endl;
cout<<"排序后: "<<endl;
for(int i=1;i<=SIZE;i++)
{
cout<<a[i]<<" ";
}
cout<<endl;
return 0;
}
//heap_sort():堆排序
/*
@param:
a:待排序数组
size:待排序数组长度
@ret:无
*/
void heap_sort(int* a,int size)
{
build_heap(a,size); //建堆
for(int i=size;i>=1;i--)
{
swap(a[i],a[1]); //交换堆顶和最后一个元素,即每次将剩余元素中的最大者放到最后面
heap_adjust(a,1,i-1); //重新调整堆顶节点成为大顶堆
}
}
//build_heap():构造初始堆
/*
@param:
a:堆元素
size:堆元素长度
@ret:
*/
void build_heap(int* a,int size)
{
//构造初始堆,从最后一个非叶节点开始调整
for(int i=size/2;i>=1;i--) //非叶节点最大序号值为size/2
{
heap_adjust(a,i,size);
}
}
//heap_adjust():调整堆(从第i节点到第size节点调整堆,实际上是调整以i节点为父节点的子树为堆)
/*
@param:
a:堆元素
i:堆第i节点
size:堆第size节点
@ret:无
*/
void heap_adjust(int* a,int i,int size)
{
int lchild=2*i; //i的左孩子节点序号
int rchild=2*i+1; //i的右孩子节点序号
int max=i;
if(i<=size/2) //i是非叶节点时进行调整
{
if( lchild<=size&&a[lchild]>a[max] )
{
max=lchild;
}
if( rchild<=size&&a[rchild]>a[max] )
{
max=rchild;
}
if(max!=i)
{
swap(a[max],a[i]);
heap_adjust(a,max,size); //避免调整之后以max为父节点的子树不是堆
}
}
}