堆排序
该节内容来自《算法导论》:第六章 堆排序
1、堆
堆给人的感觉是一个二叉树,但是其本质是一种数组对象,因为对堆进行操作的时候将堆视为一颗完全二叉树,树种每个节点与数组中的存放该节点值的那个元素对应。所以堆又称为二叉堆,堆与完全二叉树的对应关系如下图所示:
什么是完全二叉树:全二叉树从根结点到倒数第二层满足完美二叉树,最后一层可以不完全填充,其叶子结点都靠左对齐,设二叉树的深度为h,除第 h 层外,其它各层 (1~h-1) 的结点数都达到最大个数,第 h 层所有的结点都连续集中在最左边,如下图:
通常给定节点i,可以根据其在数组中的位置求出该节点的父亲节点、左右孩子节点,这三个过程一般采用宏或者内联函数实现。书上介绍的时候,数组的下标是从1开始的,所有可到:PARENT(i)=i/2 LEFT(i) = 2*i RIGHT(i) = 2*i+1。
根据节点数值满足的条件,可以将分为最大堆和最小堆。最大堆的特性是:除了根节点以外的每个节点i,有A[PARENT(i)] >= A[i],最小堆的特性是:除了根节点以外的每个节点i,有A[PARENT(i)] >=A[i]。
把堆看成一个棵树,有如下的特性:
(1)含有n个元素的堆的高度是lgn。
(2)当用数组表示存储了n个元素的堆时,叶子节点的下标是n/2+1,n/2+2,……,n。
(3)在最大堆中,最大元素该子树的根上;在最小堆中,最小元素在该子树的根上
2、保持堆的性质
堆的关键操作过程是如何保持堆的特有性质,给定一个节点i,要保证以i为根的子树满足堆性质。书中以最大堆作为例子进行讲解,并给出了递归形式的保持最大堆性的操作过程MAX-HEAPIFY。先从看一个例子,操作过程如下图所示
从图中可以看出,在节点i=2时,不满足最大堆的要求,需要进行调整,选择节点2的左右孩子中最大一个进行交换,然后检查交换后的节点i=4是否满足最大堆的要求,从图看出不满足,接着进行调整,直到没有交换为止。代码:
/*
a:数组的首地址
s:数组某位置
m:数组长度
*/
void HeapAdject(int a[], int s, int m)
{
int key = a[s];
int i;
//构造大顶椎
for (i = s * 2; i <= m; i *= 2)
{
//i定位到两个孩子中最大的那个
if (i < m && a[i] < a[i + 1])
{
i++;
}
//比较 双亲 和最大的孩子
if (key > a[i])//双亲比最大的孩子大,符合
{
break;
}//双亲赋值为最大的孩子
else
{
a[s] = a[i];//双亲赋值
s = i;
}
}
a[s] = key;
}
3、建堆
建立最大堆的过程是自底向上地调用最大堆调整程序将一个数组A[1.....N]变成一个最大堆。将数组视为一颗完全二叉树,从其最后一个非叶子节点(n/2)开始调整。调整过程如下图所示:
//构建大顶椎
for (int i = length/2; i > 0; i--)
{
HeapAdject(a,i,length);
}
4、堆排序算法
堆排序算法过程为:先调用创建堆函数将输入数组A[1...n]造成一个最大堆,使得最大的值存放在数组第一个位置A[1],然后用数组最后一个位置元素与第一个位置进行交换,并将堆的大小减少1,并调用最大堆调整函数从第一个位置调整最大堆。给出堆数组A={4,1,3,16,9,10,14,8,7}进行堆排序简单的过程如下:
(1)创建最大堆,数组第一个元素最大,执行后结果下图:
(2)进行循环,从length(a)到2,并不断的调整最大堆,给出一个简单过程如下
代码:
/*
p:堆排序
t:2018年4月28日 21:44:39
*/
#include <iostream>
using namespace std;
void HeapAdject(int a[], int s, int m)
{
int key = a[s];
int i;
//构造大顶椎
for (i = s * 2; i <= m; i *= 2)
{
//i定位到两个孩子中最大的那个
if (i < m && a[i] < a[i + 1])
{
i++;
}
//比较 双亲 和最大的孩子
if (key > a[i])//双亲比最大的孩子大,符合
{
break;
}//双亲赋值为最大的孩子
else
{
a[s] = a[i];//双亲赋值
s = i;
}
}
a[s] = key;
}
void HeapSort(int a[],int length)
{
//构建大顶椎
for (int i = length/2; i > 0; i--)
{
HeapAdject(a,i,length);
}
//筛选过程
for (int i = length; i > 1; --i)
{
//交换堆顶和最后一个元素
int tmp;
tmp = a[1];
a[1] = a[i];
a[i] = tmp;
//调整
HeapAdject(a, 1, i-1);
}
}
void Display(int a[], int len)
{
for (int i = 1; i <= len; ++i)
{
cout << a[i] << " ";
}
cout << endl;
}
int main()
{
//数组从下标1开始用,下标0中的数值0是一个垃圾值
int a[] = {0,2,3,1,5,4};
HeapSort( a, sizeof(a)/sizeof(int)-1 );
Display(a, sizeof(a) / sizeof(int)-1);
return 0;
}
堆排序算法时间复杂度:维持一个节点的最大堆性质 = O(lgn),堆排序过程中执行一个循环,调用最大堆调整函数,总的时间复杂度为O(nlgn)。