堆排序是对简单选择排序的升级,利用堆这种数据结构所设计的一种排序算法。
堆是一个完全二叉树的结构,子结点的键值或索引总是小于(或者大于)它的父节点。分为:
(1)大顶堆:每个节点的值都大于或等于其子节点的值,在堆排序算法中用于升序排列;
(2)小顶堆:每个节点的值都小于或等于其子节点的值,在堆排序算法中用于降序排列;
大(小)顶堆删除堆顶元素,将剩下的元素再次调成成大(小)顶堆,时间复杂度为
堆排序正是利用此数据结构,将选最大(小)元时间复杂度在简单排序降为,进而提升了排序算法效率。
堆排序的时间复杂度为。
1、算法步骤
(1)将待排序序列构建成一个堆 H[0……n-1],根据(升序降序需求)选择大顶堆或小顶堆;
(2)把堆首(最大值)和堆尾互换;
(3)把堆的尺寸缩小 1,并调用 max_heapify(),目的是把新的数组顶端数据调整到相应位置,继续是一个堆;
(4)重复步骤 2,直到堆的尺寸为 1。
2、动画演示
3、复杂度分析
运行时间主要消耗在初始构建堆和重建堆时的反复筛选上
对每个非终端结点来说,最多进行两次比较和互换操作,故整个构建堆的时间复杂度为
第i次取堆顶元素,并重建堆需要的时间,共需要取N-1次堆顶元素,因此重建堆的时间复杂度为。
总体来说,堆排序的时间复杂度为,对原始元素的排序状态不敏感,因此无论最好、最坏、平均时间复杂度都为。
空间复杂度上,只需要一个用来暂存的交换单元;由于比较和交换是跳跃进行,因此堆排序是不稳定的排序算法。
4、C++代码实现
#include<iostream>
using namespace std;
void max_heapify(int A[], int start, int N)
{
int parent = start;
int child = 2 * parent + 1;
//int temp = A[start];
while(child < N)
{
if(child + 1 < N && A[child] < A[child+1])//找到左右儿子中较大的一个
child++;
if(A[parent] > A[child])
break;
else
{
//A[parent] = A[child];//大的结点上移,若这样写,一定要注意找到合适位置,插入原堆顶元素
swap(A[parent], A[child]);
parent = child;
child = 2 * parent + 1;
}
}
//A[parent] = temp;
}
void Heap_Sort(int A[], int N)
{
int i;
for(i = N/2 -1; i >= 0; i--)//构建最大堆
max_heapify(A, i, N);
for(i = N-1; i > 0; i--)
{
swap(A[0], A[i]);//堆顶最大元素与末尾元素交换
max_heapify(A, 0, i);//调整堆
}
}
int main()
{
int arr[] = {15,55,88,54,2,8,13,99,23,30};
int length = sizeof(arr)/sizeof(arr[0]);
Heap_Sort(arr,length);
for(int i = 0; i < length; i++)
cout<<arr[i]<<' ';
cout<<endl;
return 0;
}
用数组存储完全二叉树时,结点的索引(数组下标)与其父子结点索引的关系:
(1)如果从下标从1开始存储,则编号为i的结点的主要关系为:
双亲:下取整 (i/2)
左孩子:2i
右孩子:2i+1
(2)如果从下标从0开始存储,则编号为i的结点的主要关系为:
双亲:下取整 ((i-1)/2)
左孩子:2i+1
右孩子:2i+2